相关知识点:

如何下载采集器;如何导入模板;如何启动采集;如何修改模板;如何批量添加网址;如何导入表格当中的链接,如何批量添加关键词等。

下载采集器:

http://www.bazhuayu.com 采集器有很多版本,最新版界面可能有所不同。

解压八爪鱼采集器安装包,安装好软件;

注册一个账号;

打开软件,使用注册好的账号登录;(可以每笔导出数据为1万条,每天导出数不限,从2018年10月10日起实施)

按规则导入视频教程将附件里面的规则(后缀名为otd的文件)

点击采集按钮(本地采集),即可采集到您所需要的数据。

注意:中途暂停采集或者软件出错,需要从头采集;

采集过程中可能因为有的页面加载不了或者页面不存在了导致出错的提示,一般1分钟就自动消失,可以不用管它,也可以直接关闭它。不影响采集的结果。

修改规则模板:

批量添加网址:

a、在打开网页外面的循环框体上,点击右上角的小齿轮

b、在设置项窗体当中,找到循环方式下面一行,有一个小笔样的图标,如下图,点击打开

c、在新的窗口界面下,手动输入可输入多行网址,将网址复制过来即可。

d、从文件批量导入网址

如下图所示操作

然后我们保存设置,就可以使用这批导入的网址进行批量采集了。

批量生成网址:

批量生成网址适合我们需要采集的网址有一些特征、比如参数有一定的规律,下面来演示一下。

我们点击批量生成,就会看到如下的界面。

下图就是一个批量生成的简单示例:我们通过关键词的批量列表,就可以通过这个生成的链接直接访问进行采集,从而避免了还要去网站当中填入关键词、点击搜索等步骤,有效的提高了工作的效率。

然后返回保存即可。

如果采集完以后的关键词不要了,也按上述步骤操作删除即可。



微信扫描下方的二维码阅读本文

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注