基本环境配置
1.NVIDIA 驱动下载
1.1 GPU
在NVIDIA驱动下载页面选择并下载与自己显卡匹配的驱动
1.2 vGPU
登录Nvidia Enterprise,下载基于KVM的驱动包,Guest_Drivers内以grid结尾的run文件即为所需驱动
2.CUDA Toolkit 下载
在NVIDIA Developer官网找到CUDA Toolkit下载页面
选择如下配置即可获得CUDA Toolkit下载地址
3.cuDNN 下载
cuDNN需要登录NVIDIA Developer账号才能下载,登陆后打开cuDNN下载地址
同意cuDNN Software License Agreement后选择Local Installer for Linux x86_64 (Tar)版本下载
4.NCCL 下载[可选]
NCCL同样需要登录NVIDIA Developer账号才能下载,登陆后打开NCCL下载地址
同意Software License Agreement后选择Local installers (x86)中的O/S agnostic local installer版本下载
至此已获得如下文件
NVIDIA-Linux-x86_64-535.54.03.run/NVIDIA-Linux-x86_64-535.54.03-grid.run
cuda_12.2.0_535.54.03_linux.run
cudnn-linux-x86_64-8.9.2.26_cuda12-archive.tar.xz
nccl_2.18.3-1+cuda12.2_x86_64.txz[可选]
下面我们进行安装
5.NVIDIA 驱动安装
sudo bash NVIDIA-Linux-x86_64-535.54.03.run
6.CUDA Toolkit 安装
sudo bash cuda_12.2.0_535.54.03_linux.run
在cuda安装过程中请不要覆盖NVIDIA驱动
安装完成后执行如下命令添加PATH和LD_LIBRARY_PATH
sudo nano ~/.bashrc
在尾部添加
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
最后执行source 使环境变量生效
source ~/.bashrc
7.cuDNN 安装
tar xvf cudnn-linux-x86_64-8.9.2.26_cuda12-archive.tar.xz
$ sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
$ sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
8.NCCL 安装
tar Jxvf nccl_2.18.3-1+cuda12.2_x86_64.txz
cd nccl_2.18.3-1+cuda12.2_x86_64/
sudo cp include/* /usr/local/cuda/include
sudo cp -r lib/* /usr/local/cuda/lib64
9.disable nouveau
echo "blacklist nouveau" >>/etc/modprobe.d/blacklist.conf
echo "options nouveau modeset=0" >>/etc/modprobe.d/blacklist.conf
rmmod nouveau
Anaconda安装
1.下载
点击打开Anaconda官网 在下载页面中选择Linux版本
2.安装
bash Anaconda3-2023.03-1-Linux-x86_64.sh
3.设置源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
Mamba安装
1.下载
点击打开Anaconda官网 在下载页面中选择Linux x86_64 (amd64)版本
2.安装
bash Mambaforge-Linux-x86_64.sh
Anaconda/Mamba 环境配置
1.创建环境
conda/mamba create -n env_name python=3.7
2.激活环境
conda/mamba activate env_name
3.查看环境
conda/mamba env list
4.删除环境
conda/mamba remove -n env_name --all
Anaconda 包配置
1.安装包
conda/mamba install paddlepaddle-gpu==2.4.2 cudatoolkit=11.7 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge
2.卸载包
conda/mamba uninstall paddlepaddle-gpu
3.查看包
conda/mamba list/conda list -n 环境名
至此深度学习环境已基本配置完毕
2 comments
啦啦啦
不错!