配置深度学习环境
背景介绍
最近为了项目需要,自己配置了一台入门级的深度学习主机,配置为13代i5-13400F+4080,接下来讲一下自己的踩坑经历和心得,希望能帮助后来人减少弯路,也当作为备忘录,以备将来再次配置环境需要.
主系统: Windows 11 Pro 22H2
WSL2子系统: Linux Ubuntu 22.04.3 LTS
重点提示
- 只需要在主系统安装NVIDIA driver:
Once a Windows NVIDIA GPU driver is installed on the system, CUDA becomes available within WSL 2. The CUDA driver installed on Windows host will be stubbed inside the WSL 2 as lib cuda. so, therefore users must not install any NVIDIA GPU Linux driver within WSL2
,不要再在wsl中重复安装驱动! - CUDA Toolkit: 在安装CUDA版本前,先考虑自己的显卡型号和自己要用的开发框架(比如torch)所适配的CUDA版本,太新的CUDA版本可能会导致其他开发平台没有合适的版本,安装后用
nvcc -V
检查当前安装的版本,nvidia-smi
显示的是支持的最高版本,并不是本机版本,如果安装错了可参照本篇文章重装 - 尽早安装conda,提早管理不同的环境(pytorch, CUDA等等),避免后续出现版本冲突.
- WSL安装位置不要装在C盘!占用大量空间,后续迁移见此文章,Docker和conda也不要在C盘装,后患无穷!
软件使用注意事项
- 最新版本的anaconda移除了用来激活环境的
conda activate XXX
的指令,改用source activate
, - anaconda中有环境嵌套的问题,需要多次
conda deactivate
- 安装某些包的时候优先conda,如果无效或者搜索不到source,再用pip
About this Post
This post is written by Rui Xu, licensed under CC BY-NC 4.0.