批量采集小红薯关键字爆款作品数据 ,15个数据字段+多条件筛选+导出Excel,盯竞品、做调研、找爆款都用得上 | 影刀RPA

在之前我开发过一款使用影刀RPA采集斗音关键字搜索爆款作品数据的应用:批量采集斗音关键字搜索爆款作品数据 ,17个数据字段+多条件筛选+导出Excel,盯竞品、做调研、找爆款都用得上!| 影刀RPA

最近又抽空写了一个红薯平台的,它俩虽然都是懒加载页面,但实操中还是遇到不少问题,主要集中在:部分数据字段是前端 UI 格式化后的模糊结果,如何拿到精准"数值型"标准数据?

有的字段直接网页源码解析就可以,有的字段则行不通,得用网页监听方式获取。有的字段在网页监听结果也是模糊结果,比如:发布时间。

有的字段在网页监听结果中是缺失的,不能通过单一搜索结果页获取,这种情况下用"request请求方式"能获取到,但是实测很容易被风控IP……

这些问题在下面这个应用中都已解决,来看一下具体功能。

一、应用介绍

这是一款基于影刀RPA开发的"红薯-关键词搜索结果采集下载"应用,用户导入搜索关键词,应用会自动打开网页搜索、批量抓取搜索结果中的作品信息和互动数据,整理成结构化的数据表格。

目前支持的具体功能点:

  • 批量高效采集:支持一次性导入多个关键词(直接写入或者读取Excel都行),一键批量采集多个关键词下的热门作品数据。
  • 灵活筛选条件:支持根据排序依据、发布时间、笔记类型、搜索范围、位置距离、点赞数阈值、指定发布时间段、采集作品数量等多个条件精准筛选搜索结果,极大提升数据采集的精度。
  • 多字段采集:支持作品链接、作品标题、作品描述、作品类型、发布时间、点赞数、评论数、收藏数、转发数、视频时长、作者名称、作者主页地址、作品封面、作品下载链接、作品话题等15个数据字段。(*使用网页监听方式采集+编码解析,都是精确数据,不存在"几天前"、"6.9万"这种前端模糊显示)
  • 智能导出Excel:自动生成规范格式的Excel文件,内置工作表列宽和表头背景色、居中、自动换行等格式设置。
  • 可视化配置:支持自定义浏览器运行方式和下载视频/图集的选项,满足不同用户的需求。

其他迁移应用场景:

  • 盯竞品/看趋势:看看同行在红薯上什么内容爆了、哪些话题正在升温,掌握行业动态与竞争对手的内容策略。
  • 做市场调研:通过关键词批量抓取数据,洞察用户在关注什么、讨论什么,真实需求和兴趣点一目了然。
  • 优化内容创作:研究爆款题材、视频形式、话题标签,总结高表现内容的共性,调整创作方向,提高出爆率。
  • 品牌舆情监测:定期检索品牌名或产品名,实时追踪网友讨论和情绪,及时发现口碑波动和潜在风险。
  • 广告投放优化:分析同类广告或内容的数据表现,找到最优发布时间、形式与内容方向,用数据指导投放。
  • 内容SEO优化拆解热门视频的标题、标签、描述策略,优化自己的内容结构,让算法更容易推送。
  • 数据研究分析:适合深度研究人员或分析师,对特定话题或人群进行趋势研究,输出有洞察力的社媒报告。

二、效果演示

以“手动输入”模式为例,我们检索"水牛奶、一分钟学会"这两个搜索词,且要求"最小点赞数为30、采集作品数量为10个",运行视频

采集红薯关键字爆款作品数据 ,15个数据字段+多条件筛选

三、如何获取&应用?

1. 启动参数说明

启动应用后,用户需要依次输入或选择以下参数:

  • 关键词导入来源方式:可以选择手动输入或从Excel读取
  • 请选择浏览器类型:支持指定主流浏览器运行
  • 最小点赞数:低于该值则不采集(*整数)
  • **采集作品数量:**采集数量达到设定阈值,则停止采集(*整数)
  • 多条件筛选:和红薯网页端筛选条件一致:排序依据、笔记类型、发布时间、搜索范围、位置距离
  • 下载视频/图集:若勾选,则下载无水印视频/图片集到本地
  • 选择文件保存路径:自定义下载存储路径
  • 指定发布日期的笔记:过滤掉不在此发布时间区间的作品

2. 环境/工具配置

  • 需要影刀RPA账号
  • 使用Chrome浏览器或其他支持的浏览器
  • 安装影刀自动化插件,软件右上角头像点击[工具-自动化插件]
  • 红薯网页版提前登录账号
  • "红薯关键词搜索采集作品"示例Excel模板
  • 应用暂时只支持Windows端

3. 注意事项

  • 在运行过程中,请不要切换或关闭浏览器页面
  • 下载视频或图集时,可能会受网络及文件大小的影响,请耐心等待完成提示
  • 请勿短期内频繁操作以防触发风控,建议使用小号

4. 应用

与其花时间盲目摸索,不如用数据看清方向。以上,下期分享见!

-END-

  • 爱练字的96年ISTJ型互联网人/信息整合怪/工具人/影刀高级认证工程师。
  • 专注分享:RPA&AI自动化场景提效方案、效率软件安利、实用技能。"所有的生产要素都可以被构建,只有认知是壁垒",欢迎関注

推荐阅读:

  • 掌心向暖:影刀RPA | Win端没有"上传文件"指令? 多少有点离谱了刀刀
  • 那些拥有上千浏览器书签/收藏夹的电脑用户,是怎么管理书签的?
  • 不会编程的我开发了一款近900行指令的自动化RPA应用,完美解决98%以上复制受限的飞书文档!!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

掌心向暖RPA自动化

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值