简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 “高级配置” 选项卡 ==》把 “只获取网址” 勾去不选择 ==》提取值类型选择 “节点属性” ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 “日期等正则提取” 选项卡 ==》正则捕获组处填写  openW\('(.*)'\)  ==》测试 ==》没问题,保存

四、结果

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值