富泰科 | 提供专业级的千万级数据采集/数据爬取服务 | 文章列表

这里有关于“数据采集”“爬虫定制”“美团外卖采集”“外卖商家数据导出”相关的产品与服务、使用教程、技术文章 – 富泰科

产品与服务

  • 实用技能 | 如何快速安装《美团外卖采集助手》并迅速上手使用 (0) 2024年5月24日futaike_admin
    美团外卖采集助手安装及使用说明:为保证软件的正常使用,需要在使用软件之前,先安装软件目录下的《node-v20.12.0-x64.msi》
  • 好用的工具 | 携程酒店价格采集助手 – 通过输入携程酒店链接,自动实时采集目标酒店的房间价格信息 (0) 2024年5月23日futaike_admin
    软件功能:通过输入携程酒店链接,自动采集目标酒店的房间价格信息。 软件更新网址:https://www.futaike.net/shop/ctrip_room_price_collection,可批量,也可设置手机推送通知、电脑通知等。软件免费下载试用。
  • 使用教程 | 美团外卖cookie更新使用说明 | 美团外卖采集助手 | 美团外卖爬虫 (0) 2022年6月17日futaike_admin
    cookie使用时效延长小技巧:在浏览器当中登录的同时,可以在手机浏览器上同步登录,然后如果遇到cookie不可用(软件提示有:keyerror这样的字符时,这时可能在电脑浏览器页面刷新会遇到验证拦截,就是验证有时也很难通过。但可以去手机浏览器的页面去刷新一下,如果需要验证,验证一下可能就通过了,也就是说在手机浏览器端访问会更容易一些。验证通过以后就又可以使用并正常抓取数据了。
  • 必看文章 | 软件运行没反应、闪退,可能是这些原因 (0) 2022年1月13日futaike_admin
    经常有小伙伴反应软件会没反应、或者闪退。这些多半是没有看使用说明就上手操作,软件的使用说明文档其实都有写明需要做的一些前期工作或者准备,下面再总结一下类似的问题以及解决办法
  • 置顶文章 | 富泰科软件使用协议及通用说明 (2) 2021年10月18日futaike_admin
    软件在启动界面或帮助菜单下均有相对应的详细的使用说明及步骤。用户需要在使用软件前阅读及掌握相应的操作步骤,本公司大部分软件都依赖谷歌浏览器,使用前请先安装最新版本的谷歌浏览器软件,安装成功后再运行软件。
  • 好软分享 | TTS模型:Kokoro,高效能和轻量化设计 (0) 2025年1月16日futaike_admin
    Kokoro TTS 的出现,打破了人们对 TTS 技术的固有印象。它以小巧的身材和强大的功能,重新定义了 TTS 模型的可能性。 在这个技术快速更迭的时代,Kokoro TTS为我们展示了轻量级模型也能拥有强大性能的无限潜力。对于语音克隆爱好者及配音人员,也提供了一个新的创作渠道。
  • 技术分享 | 自动化过谷歌yescaptcha、Cloudflare人机验证码 (0) 2025年1月15日futaike_admin
    Google reCAPTCHA 是一种基于高级风险分析技术的验证工具。它通过分析用户行为数据和交互模式,判断访问者是否为人类用户。
  • 学习研究 | 小程序数据爬取|食行生鲜、朴朴超市、京东到家等数据采集研究 (0) 2025年1月15日futaike_admin
    爬取小程序数据的方法可以依据不同的需求和技术水平有所不同。以下是一些基本步骤: 1. 确定数据需求 明确需要爬取的数据类型,比如商品信息、评论、用户评价等。 2. 了解小程序的结构 小程序一般使用了复杂的前端框架,建议先通过分析网络请求的方式了解其数据结构。 3. 法律合规性 确保爬取行为符合相关法律法规以及小程序的使用条款,避免侵犯他人权益。 4. 采用合适的工具和技术 网络抓包工具:像 Fiddler 或 Charles,可以监视和分析网络请求,查看所需数据的API接口。 Python 爬虫库:如requests等。 5. 编写爬虫程序 使用上述工具编写爬虫脚本,模拟浏览器请求,访问小程序背后的API。 6. 数据存储 根据需要选择数据存储方式(如CSV、数据库等)来保存爬取到的数据。 7. 遵守网站的爬虫策略 注意尊重网站的 robots.txt 文件,避免过于频繁的请求。 8. 处理数据 对爬取到的数据进行清洗和分析,提取有用信息。 下面我们以某生鲜小程序为例,看如何爬取: 一、我们以上图这个分类下的商品为目标,先打开小程序、抓包分析 得到数据接口,然后我们分析一下该接口,先请求一下看看。 response = requests.get(url, headers=headers, proxies=proxies, params=params)# print(response.text)data = response.json() print(f"商品名称:{ProductName}价格:{PeriodMoney}") 可以看到数据已经出来了。下面就是将分类id、翻页id等找到,然后构建好请求参数再一一请求即可。 json_str = "{\"anchor\":102105,\"categoryId\":102941,\"direction\":1,\"offset\":\"\",\"orderDirectionType\":0,\"orderFieldType\":0,\"pageSize\":20}" 分析一下,categoryid就是分类id,offset应该是翻页用的。下一页offset应该是19或者20 下面抓包分析一下,下一个offset是19,那就是从0开始的。 我们构建好翻页以下,再请求看看有没有地方是加密的。   很顺利,可以翻页请求到数据。那么这个分类下的数据就解决了。说明这个小程序的请求端暂时没有发现有加密的地方,数据获取就相对简单一些。 存储: # 保存数据到csv文件with open('生鲜小程序data.csv', 'a', encoding='utf-8') as f: f.write(f"{ProductName},{RecommendReason}, {PeriodMoney}, {DefaultMoney}\n") 抓取到的数据可以导出: 四季豆200g/份 白灼焖炒 | ...
  • 学习研究 | 2025最新阿里系淘宝天猫接口sign参数逆向研究 (0) 2025年1月14日futaike_admin
    打开淘宝网任意页面(我这里用的是搜索),按F12打开开发者工具,找到数据流对应的接口uri 点击打开,可以看到数据。那么就研究这个接口。 查看负载,可以看到有sign和其他几个值。比较明显sign应该是一个加密值。其他几个也一并看看。 我们打开请求调用的堆栈main.js,用sign:搜索,可以很快找到可能的sign所在位置。打上断点,调试看看。 可以看到sign就是eM,而eM是由一个Ip的函数带几个参数加密计算所得。 我们跳转到Ip函数所在位置。看看 可以看一eT函数,我们复制到本地来调试看: 因为sign值看起来像是md5加密后的值,所以,我们就先在本地试试看,是不是md5加密。 输出值为: 验证一下,果然就是Md5加密,那么就简单了。只要我们把相应的参数确定好。那就个sign就解决了。 下面来看看几个参数: em.token + “&” + eE + “&” + eS + “&” + ep.data 看起来是4个参数用&连接而成。分别来看: 这个em.token看起来像是服务器传过来的某个值,eE就是一个时间戳,eS可能是个固定值,ep.data就是要请求的内容了。那么先整一组试一试看看生成的结果。 看起来代码可以正常运行,生成一个Md5加密值,那么就实际当中试试如何? 我们写一个调用函数。再用Python写一段请求代码,复制登录后的cookie和请求头。token就先从源码当中找一个使用。运行: 发现搜索结果可以正常输出。OK,搞定。 那个token有一定的时效性,过期再刷新页面复制使用即可。 以上就是淘宝天猫接口sign参数逆向的学习过程。 作者:微信futaike_corp,转载请保留版权标志。
  • 软件更新 | 抖音评论采集助手 – 一键批量导出视频下的评论内容! (0) 2024年9月23日futaike_admin
    抖音评论采集助手软件功能及亮点 功能:软件可按视频链接批量下载该视频的所有评论内容。 亮点: 1、简单易用; 2、自动采集; 3、可批量采集; 4、自动导出数据; 5、字段丰富。 6、可定制额外功能。

使用教程

  • 学习研究 | 2025最新阿里系淘宝天猫接口sign参数逆向研究 (0) 2025年1月14日futaike_admin
    打开淘宝网任意页面(我这里用的是搜索),按F12打开开发者工具,找到数据流对应的接口uri 点击打开,可以看到数据。那么就研究这个接口。 查看负载,可以看到有sign和其他几个值。比较明显sign应该是一个加密值。其他几个也一并看看。 我们打开请求调用的堆栈main.js,用sign:搜索,可以很快找到可能的sign所在位置。打上断点,调试看看。 可以看到sign就是eM,而eM是由一个Ip的函数带几个参数加密计算所得。 我们跳转到Ip函数所在位置。看看 可以看一eT函数,我们复制到本地来调试看: 因为sign值看起来像是md5加密后的值,所以,我们就先在本地试试看,是不是md5加密。 输出值为: 验证一下,果然就是Md5加密,那么就简单了。只要我们把相应的参数确定好。那就个sign就解决了。 下面来看看几个参数: em.token + “&” + eE + “&” + eS + “&” + ep.data 看起来是4个参数用&连接而成。分别来看: 这个em.token看起来像是服务器传过来的某个值,eE就是一个时间戳,eS可能是个固定值,ep.data就是要请求的内容了。那么先整一组试一试看看生成的结果。 看起来代码可以正常运行,生成一个Md5加密值,那么就实际当中试试如何? 我们写一个调用函数。再用Python写一段请求代码,复制登录后的cookie和请求头。token就先从源码当中找一个使用。运行: 发现搜索结果可以正常输出。OK,搞定。 那个token有一定的时效性,过期再刷新页面复制使用即可。 以上就是淘宝天猫接口sign参数逆向的学习过程。 作者:微信futaike_corp,转载请保留版权标志。
  • 软件更新 | 抖音评论采集助手 – 一键批量导出视频下的评论内容! (0) 2024年9月23日futaike_admin
    抖音评论采集助手软件功能及亮点 功能:软件可按视频链接批量下载该视频的所有评论内容。 亮点: 1、简单易用; 2、自动采集; 3、可批量采集; 4、自动导出数据; 5、字段丰富。 6、可定制额外功能。
  • 实用文档 | 美团外卖采集软件常见问题及回答,持续更新 (0) 2024年9月2日futaike_admin
    美团外卖采集助手常见问题及回答,持续更新:这里整理了用户们在使用软件时遇到各种问题,是各位准用户们想要高效使用软件必备查询工具。
  • 教程系列 | 淘宝闪购饿了么外卖采集助手(搜索定制版)上手使用说明-详细的使用步骤说明书 (0) 2024年6月22日futaike_admin
    我们将软件下载下来,软件为绿色免安装版,解压以后,双击主程序,软件启动以后,正常会驱动打开谷歌浏览器,加载饿了么的h5客户端页面。如果我们登录好,就可以回车继续了。然后我们就可以看到浏览器会加载我们搜索的内容,软件当中也会显示采集数据出来了。
  • 实用技能 | 如何快速安装《美团外卖采集助手》并迅速上手使用 (0) 2024年5月24日futaike_admin
    美团外卖采集助手安装及使用说明:为保证软件的正常使用,需要在使用软件之前,先安装软件目录下的《node-v20.12.0-x64.msi》