这里有关于“数据采集”“爬虫定制”“美团外卖采集”“外卖商家数据导出”相关的产品与服务、使用教程、技术文章 – 富泰科
美团外卖采集助手安装及使用说明:为保证软件的正常使用,需要在使用软件之前,先安装软件目录下的《node-v20.12.0-x64.msi》
软件功能:通过输入携程酒店链接,自动采集目标酒店的房间价格信息。
软件更新网址:https://www.futaike.net/shop/ctrip_room_price_collection,可批量,也可设置手机推送通知、电脑通知等。软件免费下载试用。
cookie使用时效延长小技巧:在浏览器当中登录的同时,可以在手机浏览器上同步登录,然后如果遇到cookie不可用(软件提示有:keyerror这样的字符时,这时可能在电脑浏览器页面刷新会遇到验证拦截,就是验证有时也很难通过。但可以去手机浏览器的页面去刷新一下,如果需要验证,验证一下可能就通过了,也就是说在手机浏览器端访问会更容易一些。验证通过以后就又可以使用并正常抓取数据了。
经常有小伙伴反应软件会没反应、或者闪退。这些多半是没有看使用说明就上手操作,软件的使用说明文档其实都有写明需要做的一些前期工作或者准备,下面再总结一下类似的问题以及解决办法
软件在启动界面或帮助菜单下均有相对应的详细的使用说明及步骤。用户需要在使用软件前阅读及掌握相应的操作步骤,本公司大部分软件都依赖谷歌浏览器,使用前请先安装最新版本的谷歌浏览器软件,安装成功后再运行软件。
首先去官网下载八爪鱼采集器:http://www.bazhuayu.com/Download/DownloadHandler?version=beta 采集器版本有很多,下图演示的版本是7.6.4,新版界面可能会有所不同。
1、解压八爪鱼采集器安装包,安装好软件;
2、注册一个账号;
3、打开软件,使用注册好的账号登录;(免费版可以每笔导出数据为1万条,每天导出数不限,从2018年10月10日起实施)
4、按规则导入视频教程将附件里面的规则(后缀名为otd的文件)
5、点击采集按钮,即可采集到您所需要的数据。
规则使用说明:
对规则进行任何修改,都需要确定,然后保存才会生效。
点击:开始采集,即可进行采集了。下图就是采集界面。
采集完成,就可以导出数据了。
可以根据自己的需要来选择导出的数据格式。
采集模板下载地址: 八爪鱼采集模板 – 富泰科 (futaike.net)
1、本采集规则分为两个子任务:任务1采集发贴的网址;任务2采集详情;
请接收后放置到电脑桌面上备用。
2、采集器使用的是八爪鱼软件(以下演示版本为八爪鱼7.6版本,最新版本界面可能有所不同),下载采集器:http://www.bazhuayu.com/Download/DownloadHandler?version=beta 采集器最新版。安装后,注册一个账号。安装注册好以后,打开软件。
3、导入采集模板文件:按导入教程将上述两个采集规则导入到采集器软件当中。如下图所示:
4、规则1使用说明:
按以上设置好后,就可以采集了。结果如下:
导出到表格,备用。
5、规则2使用说明:
在采集器当中,打开规则2
打开如下图所示的红框:
依次点击确定、保存、然后就可以开始采集了。
下图是采集的实时界面。
ENJOY IT.
视频演示了如何通过后羿采集器采集微博二级评论
如何设置Chrome谷歌浏览器与chromedriver.exe版本对应