在之前我开发过一款使用影刀RPA采集斗音关键字搜索爆款作品数据的应用:批量采集斗音关键字搜索爆款作品数据 ,17个数据字段+多条件筛选+导出Excel,盯竞品、做调研、找爆款都用得上!| 影刀RPA

最近又抽空写了一个红薯平台的,它俩虽然都是懒加载页面,但实操中还是遇到不少问题,主要集中在:部分数据字段是前端 UI 格式化后的模糊结果,如何拿到精准"数值型"标准数据?

有的字段直接网页源码解析就可以,有的字段则行不通,得用网页监听方式获取。有的字段在网页监听结果也是模糊结果,比如:发布时间。
有的字段在网页监听结果中是缺失的,不能通过单一搜索结果页获取,这种情况下用"request请求方式"能获取到,但是实测很容易被风控IP……
这些问题在下面这个应用中都已解决,来看一下具体功能。
一、应用介绍
这是一款基于影刀RPA开发的"红薯-关键词搜索结果采集下载"应用,用户导入搜索关键词,应用会自动打开网页搜索、批量抓取搜索结果中的作品信息和互动数据,整理成结构化的数据表格。

目前支持的具体功能点:
- 批量高效采集:支持一次性导入多个关键词(直接写入或者读取Excel都行),一键批量采集多个关键词下的热门作品数据。
- 灵活筛选条件:支持根据排序依据、发布时间、笔记类型、搜索范围、位置距离、点赞数阈值、指定发布时间段、采集作品数量等多个条件精准筛选搜索结果,极大提升数据采集的精度。
- 多字段采集:支持作品链接、作品标题、作品描述、作品类型、发布时间、点赞数、评论数、收藏数、转发数、视频时长、作者名称、作者主页地址、作品封面、作品下载链接、作品话题等15个数据字段。(*使用网页监听方式采集+编码解析,都是精确数据,不存在"几天前"、"6.9万"这种前端模糊显示)
- 智能导出Excel:自动生成规范格式的Excel文件,内置工作表列宽和表头背景色、居中、自动换行等格式设置。
- 可视化配置:支持自定义浏览器运行方式和下载视频/图集的选项,满足不同用户的需求。
其他迁移应用场景:
- 盯竞品/看趋势:看看同行在红薯上什么内容爆了、哪些话题正在升温,掌握行业动态与竞争对手的内容策略。
- 做市场调研:通过关键词批量抓取数据,洞察用户在关注什么、讨论什么,真实需求和兴趣点一目了然。
- 优化内容创作:研究爆款题材、视频形式、话题标签,总结高表现内容的共性,调整创作方向,提高出爆率。
- 品牌舆情监测:定期检索品牌名或产品名,实时追踪网友讨论和情绪,及时发现口碑波动和潜在风险。
- 广告投放优化:分析同类广告或内容的数据表现,找到最优发布时间、形式与内容方向,用数据指导投放。
- 内容SEO优化:拆解热门视频的标题、标签、描述策略,优化自己的内容结构,让算法更容易推送。
- 数据研究分析:适合深度研究人员或分析师,对特定话题或人群进行趋势研究,输出有洞察力的社媒报告。
二、效果演示
以“手动输入”模式为例,我们检索"水牛奶、一分钟学会"这两个搜索词,且要求"最小点赞数为30、采集作品数量为10个",运行视频
采集红薯关键字爆款作品数据 ,15个数据字段+多条件筛选
三、如何获取&应用?
1. 启动参数说明
启动应用后,用户需要依次输入或选择以下参数:
- 关键词导入来源方式:可以选择手动输入或从Excel读取
- 请选择浏览器类型:支持指定主流浏览器运行
- 最小点赞数:低于该值则不采集(*整数)
- **采集作品数量:**采集数量达到设定阈值,则停止采集(*整数)
- 多条件筛选:和红薯网页端筛选条件一致:排序依据、笔记类型、发布时间、搜索范围、位置距离
- 下载视频/图集:若勾选,则下载无水印视频/图片集到本地
- 选择文件保存路径:自定义下载存储路径
- 指定发布日期的笔记:过滤掉不在此发布时间区间的作品
2. 环境/工具配置
- 需要影刀RPA账号
- 使用Chrome浏览器或其他支持的浏览器
- 安装影刀自动化插件,软件右上角头像点击[工具-自动化插件]
- 红薯网页版提前登录账号
- "红薯关键词搜索采集作品"示例Excel模板
- 应用暂时只支持Windows端
3. 注意事项
- 在运行过程中,请不要切换或关闭浏览器页面
- 下载视频或图集时,可能会受网络及文件大小的影响,请耐心等待完成提示
- 请勿短期内频繁操作以防触发风控,建议使用小号
4. 应用

与其花时间盲目摸索,不如用数据看清方向。以上,下期分享见!

-END-
- 爱练字的96年ISTJ型互联网人/信息整合怪/工具人/影刀高级认证工程师。
- 专注分享:RPA&AI自动化场景提效方案、效率软件安利、实用技能。"所有的生产要素都可以被构建,只有认知是壁垒",欢迎関注
推荐阅读:
- 掌心向暖:影刀RPA | Win端没有"上传文件"指令? 多少有点离谱了刀刀
- 那些拥有上千浏览器书签/收藏夹的电脑用户,是怎么管理书签的?
- 不会编程的我开发了一款近900行指令的自动化RPA应用,完美解决98%以上复制受限的飞书文档!!

1327

被折叠的 条评论
为什么被折叠?



