如果你需要爬取的数据是放在js里面的,那么就是动态,需要用selenium等工具抓取。
跑下面的代码,就会把网页上所有元素都打印出来。ctrl+F搜索一下,如果要找的元素在一个js object里面,就说明是动态获取到的。
import requests
from bs4 import BeautifulSoup
url = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
response = requests.get(url)
soup = BeautifulSoup(response.text,'lxml')
print(soup.prettify())
本文介绍如何通过Python的requests和BeautifulSoup库抓取静态网页内容,并利用selenium等工具处理动态加载的数据。读者将学会判断网页元素是否由JavaScript动态生成,并掌握相应抓取技巧。

1104

被折叠的 条评论
为什么被折叠?



