配置环境:
git clone https://github.com/lksky-kong/EVSSM.git
cd EVSSM
conda env create -f environment.yml
conda activate torch2.1
首先确认GPU驱动版本是否支持CUDA 12.1
nvidia-smi
命令行输出:NVIDIA-SMI 535.129.03 Driver Version: 535.129.03 CUDA Version: 12.2
,表明支持CUDA 12.1。
安装好其他所有依赖:
pip install -r requirements_basicsr.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
运行bash train.sh,报错核心:ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory: '/home/zkk/miniconda3/envs/torch2.1/lib/python3.10/site-packages/torch/include/ATen/ATen.h'
这表示:pip 在安装或升级 torch 时,检测到旧的 torch 残留文件夹,但其中部分核心头文件(如 ATen.h)缺失,导致安装中断。也就是说环境里 torch 没完全卸载干净,pip 在覆盖时出错。要彻底清除旧的 PyTorch 文件夹后再装。
清除删除残留的torch:
步骤 1:彻底删除残留的 torch 目录
rm -rf /home/zkk/miniconda3/envs/torch2.1/lib/python3.10/site-packages/torch*
步骤2:确认删除成功
ls /home/zkk/miniconda3/envs/torch2.1/lib/python3.10/site-packages/ | grep torch
命令行输出:functorch(没有输出,说明清理干净)
说明当前 torch 主包确实已经被清理干净,只剩下 functorch(这是 PyTorch 的一个子包,没问题,可以保留)。
安装对应的Pytorch和CUDA:
在已经安装CUDA 12.1的系统中安装对应的PyTorch,以确保能够利用GPU进行计算
pip install torch==2.1.0+cu121 torchvision==0.16.0+cu121 torchaudio==2.1.0+cu121 -i https://download.pytorch.org/whl/cu121
命令行显示:Successfully installed torch-2.1.0+cu121 torchaudio-2.1.0+cu121 torchvision-0.16.0+cu121,即成功安装。
pip install git+https://github.com/state-spaces/mamba.git@v2.2.3 --no-build-isolation


2630

被折叠的 条评论
为什么被折叠?



