基本环境配置

1.NVIDIA 驱动下载

1.1 GPU

NVIDIA驱动下载页面选择并下载与自己显卡匹配的驱动

NVIDIA驱动下载页面

1.2 vGPU

登录Nvidia Enterprise,下载基于KVM的驱动包,Guest_Drivers内以grid结尾的run文件即为所需驱动
Nvidia Enterprise下载界面

2.CUDA Toolkit 下载

NVIDIA Developer官网找到CUDA Toolkit下载页面
选择如下配置即可获得CUDA Toolkit下载地址
CUDA Toolkit选项

3.cuDNN 下载

cuDNN需要登录NVIDIA Developer账号才能下载,登陆后打开cuDNN下载地址
cuDNN下载页面
同意cuDNN Software License Agreement后选择Local Installer for Linux x86_64 (Tar)版本下载

4.NCCL 下载[可选]

NCCL同样需要登录NVIDIA Developer账号才能下载,登陆后打开NCCL下载地址
NCCL下载页面
同意Software License Agreement后选择Local installers (x86)中的O/S agnostic local installer版本下载

至此已获得如下文件

NVIDIA-Linux-x86_64-535.54.03.run/NVIDIA-Linux-x86_64-535.54.03-grid.run
cuda_12.2.0_535.54.03_linux.run
cudnn-linux-x86_64-8.9.2.26_cuda12-archive.tar.xz
nccl_2.18.3-1+cuda12.2_x86_64.txz[可选]

下面我们进行安装

5.NVIDIA 驱动安装

sudo bash NVIDIA-Linux-x86_64-535.54.03.run

6.CUDA Toolkit 安装

sudo bash cuda_12.2.0_535.54.03_linux.run

在cuda安装过程中请不要覆盖NVIDIA驱动
安装完成后执行如下命令添加PATH和LD_LIBRARY_PATH

sudo nano ~/.bashrc

在尾部添加

export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64

最后执行source 使环境变量生效

source ~/.bashrc

7.cuDNN 安装

tar xvf cudnn-linux-x86_64-8.9.2.26_cuda12-archive.tar.xz

$ sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include 
$ sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 
$ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

8.NCCL 安装

tar Jxvf nccl_2.18.3-1+cuda12.2_x86_64.txz
cd nccl_2.18.3-1+cuda12.2_x86_64/

sudo cp include/* /usr/local/cuda/include
sudo cp -r lib/* /usr/local/cuda/lib64

9.disable nouveau

echo  "blacklist nouveau" >>/etc/modprobe.d/blacklist.conf
echo  "options nouveau modeset=0" >>/etc/modprobe.d/blacklist.conf
rmmod nouveau

Anaconda安装

1.下载

点击打开Anaconda官网 在下载页面中选择Linux版本
Anaconda下载页面

2.安装

bash Anaconda3-2023.03-1-Linux-x86_64.sh

3.设置源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

Mamba安装

1.下载

点击打开Anaconda官网 在下载页面中选择Linux x86_64 (amd64)版本

2.安装

bash Mambaforge-Linux-x86_64.sh

Anaconda/Mamba 环境配置

1.创建环境

conda/mamba create -n env_name python=3.7

2.激活环境

conda/mamba activate env_name

3.查看环境

conda/mamba env list

4.删除环境

conda/mamba remove -n env_name --all

Anaconda 包配置

1.安装包

conda/mamba install paddlepaddle-gpu==2.4.2 cudatoolkit=11.7 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

2.卸载包

conda/mamba uninstall paddlepaddle-gpu

3.查看包

conda/mamba list/conda list -n 环境名

至此深度学习环境已基本配置完毕

Last modification:July 11, 2023
如果觉得我的文章对你有用,请随意赞赏