(1)提取标签之间的内容:规则/text() type(result)=
result = html.xpath('//div[@class="hd"]/span/text()')
(2)提取标签之间的超链接:'规则',不需要text()啦!!!
result_url_list = html.xpath('//div[@class="info"]//a/@href')
本文分享了使用XPath提取网页数据的两大技巧:一是如何精准获取标签内的文本内容;二是如何高效捕获标签间的超链接,为网络爬虫项目提供实用指南。
(1)提取标签之间的内容:规则/text() type(result)=
result = html.xpath('//div[@class="hd"]/span/text()')
(2)提取标签之间的超链接:'规则',不需要text()啦!!!
result_url_list = html.xpath('//div[@class="info"]//a/@href')
2154
2121

被折叠的 条评论
为什么被折叠?
