微博爬虫 | 介绍一款简单又傻瓜的微博评论爬取下载小工具

今天给大家分享一款简单到有点简陋的微博评论专门的爬取下载小工具。很多同学写论文、自媒创作想要从微博上去爬取一些素材,总是感到力不从心,有了这款小工具,相信以后就再也不用发愁了。

言归正传,下面我们就来看看这款小工具:

简单又傻瓜的微博评论爬取下载小工具 - 富泰科
简单或者说简陋的界面

我们先打开更新cookie的教程链接,更新一下软件目录下的weibo_cookie,因为微博是需要登录后才可以显示更多内容的。所以这个登录信息必须要提前做,不然将只能查看一页也就是只能采集到一页的评论内容。

参考这个教程,手动获取cookie操作指导 – 富泰科 (futaike.net),我们将最新的cookie值复制到这个文件当中,保存。

简单又傻瓜的微博评论爬取下载小工具 - 富泰科
cookie文件
简单又傻瓜的微博评论爬取下载小工具 - 富泰科
cookie值要复制到文件当中,过期了要更新一下

这个Mid,也就是博文采集表格当中的这列字段,对应后面的评论数,我们随便找一个。

简单又傻瓜的微博评论爬取下载小工具 - 富泰科

复制一下,粘贴到软件当中,回车,软件就自动运行了。

简单又傻瓜的微博评论爬取下载小工具 - 富泰科
软件采集过程

一会就采集了几页,速度还挺快

简单又傻瓜的微博评论爬取下载小工具 - 富泰科
软件采集过程

等软件采集完,我们再来到软件目录下,我们发现目录下已经自动生成了一个表格文件,我们双击打开。

简单又傻瓜的微博评论爬取下载小工具 - 富泰科
导出的文件

发现一级及二级评论均已经在表格当中了,字段包括评论数,点赞数,评论内容、评论用户、时间等。

简单又傻瓜的微博评论爬取下载小工具 - 富泰科
数据导出的表格

而且表格还将对应二级评论的上一级进行了前后对应,省去了我们用其他采集器时,采集是分开的,还需要自己动手整理的麻烦,很是贴心。

另外,我们发现这个软件的收费版还有一个支持多个mid一起批量采集下载的功能,软件提示如果有需求,可以将多个mid输入到软件目录下的mid_list.txt文本当中,一行一个,然后启动软件,回车采集即可。这个功能对应需要大量评论文本采集的同学来说,可以说是极为方便了。有兴趣的同学可以进一步了解。

下载链接直达:免费软件:新浪微博博文下评论含评论回复采集下载 – 富泰科 (futaike.net)

相关文章:

随便说两句: