1. 环境准备:从零搭建你的自动化“工具箱”
想用Python控制浏览器,像真人一样点点划划,第一步就是把“家伙事儿”备齐。这就像你要组装一台电脑,得先买齐CPU、主板、内存一样。别担心,整个过程我带着你一步步来,保证清晰无坑。
首先,你得确保电脑上已经安装了Python。怎么检查?很简单,打开你的命令行(Windows上是“命令提示符”或PowerShell,Mac/Linux上是“终端”),输入 python --version 或者 python3 --version。如果蹦出来一个像“Python 3.9.5”这样的版本号,恭喜你,第一步就完成了。如果提示“不是内部或外部命令”,那你就需要先去Python官网下载安装包,记得安装时一定要勾选“Add Python to PATH”这个选项,这是很多新手会忽略的关键一步。我建议直接安装Python 3.7以上的版本,兼容性更好。
有了Python,接下来安装我们的核心武器——Selenium库。Selenium本质上是一个让你能用代码遥控浏览器的工具包。安装它超级简单,还是在刚才的命令行里,输入 pip install selenium 然后回车。pip是Python自带的“软件商店”,这条命令就是告诉它:“去,给我把Selenium这个软件下载安装好。”你会看到屏幕上刷刷刷滚过很多下载信息,最后出现“Successfully installed selenium-xx.xx”就表示搞定了。这里有个小技巧,如果你在国内,觉得下载速度慢,可以试试用国内的镜像源,比如加上 -i https://pypi.tuna.tsinghua.edu.cn/simple,完整的命令就是 pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple,速度会快很多。
光有Selenium还不够,它只是个“遥控器”,我们还需要一个具体的“浏览器机器人”来执行命令。这就是浏览器驱动,最常用的就是Chrome的驱动——Chromedriver。这里有个关键点:驱动版本必须和你电脑上安装的Chrome浏览器版本匹配,否则就会报错。怎么查看Chrome版本?打开Chrome浏览器,点击右上角的三个点,进入“帮助”->“关于Google Chrome”,就能看到版本号了,比如“版本 91.0.4472.124”。
知道了版本号,我们去下载对应的Chromedriver。最官方的地址是谷歌的存储服务器,但国内访问可能不太稳定。我通常使用淘宝的镜像站,速度很快:https://npm.taobao.org/mirrors/chromedriver/。打开这个页面,你会看到很多以版本号命名的文件夹。找到与你Chrome浏览器主版本号(比如91)一致的文件夹点进去,下载里面适合你操作系统的压缩包(Windows选chromedriver_win32.zip,Mac选chromedriver_mac64.zip,Linux选chromedriver_linux64.zip)。
下载完成后,把它解压出来,你会得到一个名为chromedriver(Windows是chromedriver.exe)的文件。这个文件放哪里很有讲究。我推荐两种方式:第一种是把它放在一个你容易找到的固定目录,比如D:\tools\,然


6586

被折叠的 条评论
为什么被折叠?



