Windows系统下MMPose从安装到实战:避坑指南与视频姿态估计全流程
如果你是一位在Windows平台上耕耘的开发者或研究者,对计算机视觉,特别是人体姿态估计感兴趣,那么OpenMMLab的MMPose工具箱很可能已经进入了你的视野。这个由商汤科技开源的项目,集成了从2D到3D、从人体到动物的多种姿态估计算法,预训练模型丰富,文档也日趋完善,无疑是快速上手和开展研究的利器。然而,理想很丰满,现实往往会在安装环节给你设置几个“路障”,尤其是在Windows环境下。那些在Linux上一条命令就能搞定的事情,在Windows上可能会因为环境变量、编译依赖、路径格式等问题变得棘手。这篇文章,就是为你准备的。我将以一个在Windows上“踩过坑”的实践者身份,带你走通从零搭建MMPose环境,到最终运行视频姿态估计demo的全过程。我们会重点关照那些官方文档可能一笔带过,但在Windows上却频频报错的细节,比如恼人的poseval安装问题,以及如何优雅地处理视频流。我们的目标不仅是“跑起来”,更是理解每一步背后的逻辑,让你在遇到新问题时也能从容应对。
1. 环境奠基:构筑稳固的Python与PyTorch基石
在开始安装任何开源库之前,一个干净、可控的Python环境是成功的一半。对于MMPose这类深度依赖特定版本PyTorch和CUDA的工具包,这一点尤为重要。我强烈建议使用Anaconda或Miniconda来管理你的环境,它能有效隔离不同项目间的依赖冲突。
首先,打开你的Anaconda Prompt(这是Windows上的推荐终端,它确保了conda命令的正确执行)。我们将创建一个新的虚拟环境,专门用于MMPose项目。
conda create -n mmpose-win python=3.8 -y
这里选择Python 3.8是一个比较稳妥的版本,它在兼容性和库支持上达到了很好的平衡。环境名称mmpose-win可以自定义。
创建完成后,激活这个环境:
conda activate mmpose-win
接下来是安装PyTorch。这是整个环节中最关键的一步,因为后续的mmcv-full(MMPose的视觉基础库)需要根据特定的PyTorch和CUDA版本进行编译。请务必前往PyTorch官网,使用其提供的安装命令生成器。你需要根据自己机器的实际情况选择:
- PyTorch Build: 稳定版(Stable)即可。
- Your OS: Windows。
- Package: 推荐使用Conda,如果网络条件好也可以用Pip。
- Language: Python。
- Compute Platform: 这是核心。如果你有NVIDIA显卡并已安装好对应版本的CUDA驱动(可通过
nvidia-smi命令查看驱动支持的CUDA最高版本),请选择对应的CUDA版本(如CUDA 11.3)。如果没有显卡或想先使用CPU版本,则选择CPU。
假设你的机器支持CUDA 11.3,通过官网生成器得到的命令可能如下:
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
执行后,建议验证一下安装是否成功:
import torch
print(torch.__version__) # 应显示如 1.12.0 或更高
print(torch.cuda.is_available()) # 应返回 True(如果安装了CUDA版本)
注意:CUDA驱动版本、PyTorch安装的CUDA工具包版本(cudatoolkit)、以及后续
mmcv-full编译指定的CUDA版本,这三者不需要完全一致,但必须兼容。通常,驱动版本需要大于等于工具包版本


7166

被折叠的 条评论
为什么被折叠?



