# 1. 更新系统包
sudo apt update
sudo apt upgrade -y
# 2. 检测显卡型号
lspci | grep -i nvidia
# 3. 添加显卡驱动PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
# 4. 查看可用驱动版本
ubuntu-drivers devices
# 5. 自动安装推荐驱动(或手动指定版本)
sudo ubuntu-drivers autoinstall
# 或手动安装指定版本
# sudo apt install nvidia-driver-535 # 根据推荐的版本号
# 6. 重启系统
sudo reboot
# 7. 验证安装
nvidia-smi
# 1. 卸载旧驱动
sudo apt purge nvidia*
sudo apt autoremove
# 2. 禁用nouveau驱动
echo -e "blacklist nouveau\noptions nouveau modeset=0" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
sudo update-initramfs -u
sudo reboot # 重启
# 3. 下载官方驱动
# 访问 https://www.nvidia.cn/Download/index.aspx 选择对应驱动
# 或使用命令行(示例为版本535)
wget https://us.download.nvidia.com/XFree86/Linux-x86_64/535.154.05/NVIDIA-Linux-x86_64-535.154.05.run
# 4. 安装依赖
sudo apt install build-essential libglvnd-dev pkg-config
# 5. 关闭图形界面
sudo systemctl stop gdm # 或 lightdm
sudo telinit 3
# 6. 安装驱动
sudo sh NVIDIA-Linux-x86_64-*.run
# 1. 下载CUDA安装包(选择适合版本)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
# 2. 安装密钥包
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
# 3. 安装CUDA(完整安装)
sudo apt install cuda -y
# 4. 或安装指定版本
# sudo apt install cuda-12-3 # CUDA 12.3
# 5. 配置环境变量
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
# 6. 验证安装
nvcc --version
# 1. 从官网下载(例如CUDA 12.3)
wget https://developer.download.nvidia.com/compute/cuda/12.3.0/local_installers/cuda_12.3.0_545.23.06_linux.run
# 2. 运行安装程序
sudo sh cuda_12.3.0_545.23.06_linux.run
# 注意:如果已经安装了驱动,在安装选项中去掉Driver的勾选
# 1. 从NVIDIA官网下载cuDNN
# 需要注册账号:https://developer.nvidia.com/cudnn
# 选择对应CUDA版本的cuDNN
# 2. 安装运行时库(示例为CUDA 12.x)
sudo dpkg -i cudnn-local-repo-ubuntu2204-8.9.7.29_1.0-1_amd64.deb
# 3. 导入密钥
sudo cp /var/cudnn-local-repo-*/cudnn-local-*-keyring.gpg /usr/share/keyrings/
# 4. 更新并安装
sudo apt update
sudo apt install libcudnn8 libcudnn8-dev libcudnn8-samples
# 5. 验证安装
cp -r /usr/src/cudnn_samples_v8/ $HOME
cd $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
./mnistCUDNN
# 1. 下载cuDNN tar文件
# cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
# 2. 解压并复制文件
tar -xvf cudnn-linux-x86_64-*.tar.xz
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
# 3. 验证版本
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
# 检查NVIDIA驱动
nvidia-smi
# 检查CUDA
nvcc --version
# 检查cuDNN
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
# 运行CUDA测试程序
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
# 测试PyTorch是否能用GPU
python3 -c "import torch; print(torch.cuda.is_available())"
# 禁用Secure Boot
sudo mokutil --disable-validation
# 或进入BIOS关闭Secure Boot
# 移除旧版本
sudo apt remove --purge cuda*
sudo apt autoremove
# 清理/usr/local/cuda软链接
sudo rm -rf /usr/local/cuda*
# 如果命令找不到,确保路径正确
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
# PyTorch(带CUDA支持)
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
# TensorFlow(带GPU支持)
pip3 install tensorflow[and-cuda]
# 或使用conda
conda install pytorch torchvision torchaudio cudatoolkit=11.8 -c pytorch -c conda-forge
重要提示:
驱动、CUDA和cuDNN版本需要匹配 安装前查看官方兼容性矩阵 建议使用长期支持版(LTS)以获得更好的稳定性 如果使用Docker,可直接使用NVIDIA官方镜像避免复杂的安装过程