本文介绍使用GPU的 Pytorch 深度学习环境的配置,在安装Pytorch之前,需要先确保安装NVIDIA驱动、CUDA和cuDNN.
安装NVIDA GPU显卡驱动
- 查询显卡型号
- 官网下载适合自己显卡的驱动.run文件
- 卸载原有的NVIDIA驱动,sudo apt-get remove –purge nvidia* sudo apt-get autoremove;如果是使用官网下载的.run驱动,找到安装文件sudo ./*.run –uninstall
- 禁用nouveau驱动sudo gedit /etc/modprobe.d/blacklist.conf,在末尾添加:blacklist nouveau,然后执行:sudo update-initramfs -u,重启进入命令行界面后执行:lsmod | grep nouveau。如果没有屏幕输出,说明禁用nouveau成功。
- 进入Ctrl+Alt+F3进入命令行模式,关闭gdm服务sudo /etc/init.d/gdm3 stop
- 找到下载的驱动安装,sudo ./*.sh -no-opengl-files(务必加上此参数)
- 重启sudo reboot
安装CUDA10.1
- 官网下载linux, x86_64, Ubuntu, 18.04(或17.04)的runfile
- 安装
$ sudo sh cuda_10.0.130_410.48_linux.run
按空格读完声明,在安装过程中会询问是否安装显卡驱动,我们已经安装所以将驱动项去掉即可。安装完成后可能会有警告,提示samplees缺少一些包,暂时忽略,没有影响。
- 配置环境变量
sudo gedit ~/.bashrc
在.bashrc中添加下面Path
# add cuda
export CUDA_HOME=/usr/local/cuda
export PATH=PATH:CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64{LD_LIBRARY_PATH:+:{LD_LIBRARY_PATH}}
source使其生效
$ source ~/.bashrc
- 验证
$ nvcc -V
- 编译sample验证
$ cd /usr/local/cuda/samples/1_Utilities/deviceQuery
$ sudo make
$ ./deviceQuery
编译成功说明安装完成。
- 显示驱动信息和CUDA版本
$ nvidia-smi
安装cuDNN
官网注册下载,下载uDNN v7.5.0 (Feb 25, 2019), for CUDA 10.1,注意与CUDA版本保持对应!
解压文件后,复制相应文件至cuda中并更改权限,具体如下:
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
$ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
验证查看CuDNN版本
$ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
安装Pytorch
Pytorch官网下载安装pip或conda版本的pytorch
注意Pytorch版本需要和CUDA版本相对应!
Stable, Linux, Pip, Python3.6, CUDA10
0 条评论