当前位置: 首页 > article >正文

Ubuntu 20.04 安装 CUDA 和 cuDNN 避坑指南:从驱动卸载到环境配置全流程

Ubuntu 20.04 深度学习环境配置全攻略CUDA与cuDNN安装避坑指南在深度学习领域GPU加速已成为模型训练的标准配置。对于使用Ubuntu系统的开发者而言正确安装NVIDIA的CUDA和cuDNN工具包是搭建高效开发环境的第一步。本文将带你从零开始避开常见陷阱完成Ubuntu 20.04系统下的完整GPU开发环境配置。1. 准备工作与环境检查在开始安装之前我们需要确保系统处于干净的状态并准备好必要的依赖项。许多安装失败的问题都源于前期准备不足。首先彻底移除系统中可能存在的旧版NVIDIA驱动sudo apt-get purge nvidia* sudo apt-get autoremove接下来更新软件包列表并安装基础编译工具sudo apt-get update sudo apt-get install -y build-essential gcc g make检查当前显卡硬件信息lspci | grep -i nvidia注意如果命令没有输出请确认你的机器确实配备了NVIDIA显卡并且显卡已正确安装。禁用系统默认的nouveau驱动是必须的步骤否则会导致驱动冲突。创建配置文件sudo vim /etc/modprobe.d/blacklist-nouveau.conf添加以下内容blacklist nouveau options nouveau modeset0更新initramfs并重启sudo update-initramfs -u sudo reboot重启后验证nouveau是否已禁用lsmod | grep nouveau如果没有任何输出表示禁用成功。2. NVIDIA驱动安装详解驱动安装是整个过程中最容易出错的环节。我们推荐直接从NVIDIA官网下载适合的驱动版本。访问NVIDIA驱动下载页面根据你的显卡型号选择对应的驱动版本。下载得到.run文件后执行以下步骤chmod x NVIDIA-Linux-x86_64-530.41.03.run sudo ./NVIDIA-Linux-x86_64-530.41.03.run --no-opengl-files --no-x-check --no-nouveau-check安装过程中可能会遇到几个常见问题The distribution-provided pre-install script failed! - 选择继续安装Would you like to register the kernel module sources with DKMS? - 选择NoNvidias 32-bit compatibility libraries? - 选择NoRun the nvidia-xconfig utility? - 选择Yes安装完成后验证驱动是否正常工作nvidia-smi如果遇到问题可以尝试使用Ubuntu官方仓库中的驱动ubuntu-drivers devices sudo apt install nvidia-driver-535提示驱动版本号应根据你的显卡型号选择较新的显卡需要更新的驱动版本。3. CUDA Toolkit安装与配置CUDA是NVIDIA提供的并行计算平台和编程模型。安装前请确认你的显卡支持的CUDA版本。访问CUDA Toolkit Archive选择适合的版本。对于Ubuntu 20.04推荐使用CUDA 11.x系列。使用deb方式安装wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda-repo-ubuntu2004-11-2-local_11.2.0-460.27.04-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu2004-11-2-local_11.2.0-460.27.04-1_amd64.deb sudo apt-key add /var/cuda-repo-ubuntu2004-11-2-local/7fa2af80.pub sudo apt-get update sudo apt-get -y install cuda安装完成后需要配置环境变量。编辑~/.bashrc文件vim ~/.bashrc在文件末尾添加export PATH/usr/local/cuda-11.2/bin${PATH::${PATH}} export LD_LIBRARY_PATH/usr/local/cuda-11.2/lib64${LD_LIBRARY_PATH::${LD_LIBRARY_PATH}} export CUDA_HOME/usr/local/cuda-11.2使配置生效source ~/.bashrc验证CUDA安装cd /usr/local/cuda-11.2/samples/1_Utilities/deviceQuery sudo make ./deviceQuery如果看到Result PASS表示CUDA安装成功。4. cuDNN安装与验证cuDNN是NVIDIA提供的深度神经网络加速库需要与CUDA版本匹配。从NVIDIA cuDNN页面下载对应版本的cuDNN Library for Linux需要注册NVIDIA开发者账号。下载后解压并安装tar -xzvf cudnn-11.2-linux-x64-v8.1.1.33.tgz sudo cp cuda/include/cudnn.h /usr/local/cuda-11.2/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64 sudo chmod ar /usr/local/cuda-11.2/include/cudnn.h /usr/local/cuda-11.2/lib64/libcudnn*验证cuDNN安装cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2应该能看到类似如下的输出#define CUDNN_MAJOR 8 #define CUDNN_MINOR 1 #define CUDNN_PATCHLEVEL 15. 常见问题排查与优化建议即使按照上述步骤操作仍可能遇到各种问题。以下是一些常见问题的解决方案问题1nvidia-smi命令显示No devices were found可能原因显卡驱动未正确安装Secure Boot未禁用显卡物理连接问题解决方案sudo mokutil --disable-validation sudo reboot问题2CUDA samples编译失败可能缺少依赖库安装以下包sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev性能优化建议设置GPU性能模式为最高sudo nvidia-smi -pm 1 sudo nvidia-smi -ac 5001,1590在Docker中使用GPU时确保安装了nvidia-container-toolkitdistribution$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update sudo apt-get install -y nvidia-container-toolkit sudo systemctl restart docker监控GPU使用情况watch -n 1 nvidia-smi在实际项目中我遇到过多次驱动版本不匹配导致的问题。建议在开始新项目前先确认框架官方文档推荐的CUDA和cuDNN版本组合避免兼容性问题。对于TensorFlow和PyTorch等主流框架通常可以在其官网找到版本对应表。

相关文章:

Ubuntu 20.04 安装 CUDA 和 cuDNN 避坑指南:从驱动卸载到环境配置全流程

Ubuntu 20.04 深度学习环境配置全攻略:CUDA与cuDNN安装避坑指南 在深度学习领域,GPU加速已成为模型训练的标准配置。对于使用Ubuntu系统的开发者而言,正确安装NVIDIA的CUDA和cuDNN工具包是搭建高效开发环境的第一步。本文将带你从零开始&…...

Debug神器:C语言assert断言的5个高效用法

C语言assert断言的5个高效调试技巧 调试是每个程序员日常工作中不可避免的环节,而assert断言就像一位沉默的代码卫士,能在关键时刻帮你揪出那些隐藏的bug。不同于普通的打印调试,assert提供了一种更系统化的验证机制,尤其适合处理…...

华为OD机考实战:多语言实现App防沉迷系统的时间段冲突与优先级调度

1. 防沉迷系统的核心逻辑解析 这个题目模拟了一个非常实用的场景——手机App防沉迷系统。我第一眼看到这个题目时,感觉特别亲切,因为现在手机上各种App确实很容易让人沉迷。系统的主要功能是管理不同App的使用时间段,确保在特定时间段内只能使…...

从零到一:HNU计算机系统实验原型机vspm1.0实战与miniCC编译初探

1. 初识HNU计算机系统实验原型机vspm1.0 第一次接触vspm1.0原型机时,我完全被这个精巧的教学工具吸引了。作为一个计算机系统初学者,最让我惊喜的是它用不到200行汇编指令就完整模拟了冯诺伊曼体系结构的核心要素。这台原型机配备了6个通用寄存器&#x…...

中山大学LaTeX论文模板配置指南:从环境搭建到高效写作

中山大学LaTeX论文模板配置指南:从环境搭建到高效写作 【免费下载链接】sysu-thesis 中山大学 LaTeX 论文项目模板 项目地址: https://gitcode.com/gh_mirrors/sy/sysu-thesis 一、问题导入:为什么需要专业的LaTeX环境配置? 对于中山…...

FormCreate事件监听全攻略:从‘change’到‘control’,让你的表单真正‘活’起来

FormCreate事件监听全攻略:从‘change’到‘control’,让你的表单真正‘活’起来 表单开发从来不只是静态字段的堆砌。当你的用户需要根据前一个选择动态调整后续选项,当表单提交前需要实时校验多个字段的关联性,当字段间的显示逻…...

Unity3D毕业设计新手入门:从零构建可交付的2D游戏项目

最近在帮学弟学妹们看Unity毕业设计项目,发现一个挺普遍的现象:很多同学虽然能实现各种炫酷的功能,但项目内部却像一锅“意大利面”——脚本相互引用、资源乱放、场景一打开就卡顿,答辩演示时还容易出各种意外。这其实不是技术问题…...

别再折腾网络了!实测用Docker拉取Autoware镜像的几种靠谱方法(附完整代理配置)

高效获取Autoware Docker镜像的实战指南 引言 在自动驾驶开发领域,Autoware作为开源的自动驾驶软件栈,已经成为众多研究者和工程师的首选工具。然而,对于国内开发者而言,获取Autoware的Docker镜像往往成为项目启动的第一道门槛。本…...

3步打造本地化文档处理中枢:Convert-Lite全流程效率提升指南

3步打造本地化文档处理中枢:Convert-Lite全流程效率提升指南 【免费下载链接】convert-lite flashai-convert-lite,离线免费文档转换工具,支持pdf to markdown,word to markdown,excel to markdown,ppt to markdown, html to markdown,image …...

FreeCAD+AI实战:手把手教你用CAD-Assistant自动生成3D模型(附避坑指南)

FreeCADAI实战:手把手教你用CAD-Assistant自动生成3D模型(附避坑指南) 在传统CAD设计流程中,从手绘草图到可编辑的3D模型往往需要经历繁琐的描线、约束添加和参数调整。CAD-Assistant的出现彻底改变了这一局面——这款基于工具增强…...

先收藏 | OWASP Top10 第二坑:Java开发踩过的配置漏洞

OWASP 2025最新风险榜单出炉,安全配置错误稳居第二,数据戳破行业假象:100%被测Java应用全中招,总漏洞数超71.9万次。很多Java程序员自嘲:写得了高并发、调得通分布式,却栽在最基础的配置细节上。这些看似不…...

终极指南:5步掌握GLM-4-Voice智能语音对话系统

终极指南:5步掌握GLM-4-Voice智能语音对话系统 【免费下载链接】GLM-4-Voice GLM-4-Voice | 端到端中英语音对话模型 项目地址: https://gitcode.com/gh_mirrors/gl/GLM-4-Voice 想要构建真正智能的语音对话AI吗?GLM-4-Voice作为智谱AI推出的端到…...

AI率过高必看!4大核心方法+5款实用工具,SpeedAI真滴强!

现在各大AI检测机制越来越严格,不管是高校学生写毕业论文、职场人做方案汇报,还是自媒体输出原创内容,“AI检测率超标”都成了最头疼的问题——轻的要反复返工修改,严重的甚至会影响学分认定、项目评审结果。今天给大家整理了一套…...

锁明明还没过期,为什么另一个线程能抢进去?

做分布式开发的时候,大家对 Redis 分布式锁应该都不陌生。为了防止锁死,比如服务器突然断电,锁永远不释放,我们通常都会给锁加一个过期时间(TTL)。写代码的时候,我们心里的算盘是这样打的&#…...

OpenClaw版本升级:nanobot无缝迁移指南

OpenClaw版本升级:nanobot无缝迁移指南 1. 升级前的准备工作 上周我在本地开发环境遇到了一个棘手的问题——现有的nanobot实例无法兼容最新的OpenClaw框架功能。这迫使我不得不面对版本升级这个"技术债"。经过三天的反复尝试,我总结出一套可…...

番茄小说下载器:用Rust打造的全能离线阅读解决方案

番茄小说下载器:用Rust打造的全能离线阅读解决方案 【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版 项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 你是否曾经在地铁上看到精彩的小说章节却因网络信号不佳而中断&…...

Win10下Excel数据源配置全攻略:ODBC连接保姆级教程(含常见问题解决)

Win10下Excel数据源配置全攻略:ODBC连接保姆级教程(含常见问题解决) 在数据分析与报表自动化领域,Excel作为最普及的工具之一,经常需要与其他系统进行数据交互。ODBC(开放数据库互连)技术就像一…...

SenseVoice-Small模型在软件测试自动化中的应用:语音交互功能测试

SenseVoice-Small模型在软件测试自动化中的应用:语音交互功能测试 最近和几个做软件测试的朋友聊天,他们都在抱怨同一个问题:现在带语音交互功能的App和系统越来越多了,什么手机助手、智能车机、智能家居控制,测试起来…...

Web前端开发毕业设计项目实战:从零搭建一个高可用、可扩展的TodoList应用

很多同学在做前端毕业设计时,常常感觉无从下手,要么功能太简单显得单薄,要么技术选型混乱,代码写得像“一锅粥”,答辩时被老师问得哑口无言。今天,我们就来一起动手,从零搭建一个结构清晰、技术…...

SEO_从零开始,手把手教你制定SEO优化方案(216 )

SEO:从零开始,手把手教你制定SEO优化方案 在当今互联网时代,搜索引擎优化(SEO)已经成为任何网站希望获得高流量和高曝光的关键。对于新手来说,SEO可能看起来复杂且充满谜团。本文将从零开始,手把手教你如何…...

68聊天数据恢复实战:从误删到完整找回的解决方案

1. 当68聊天记录消失时,先别慌! 那天我正在整理手机内存,手指一滑不小心把整个68聊天对话框给删了——里面存着半年多的客户沟通记录和重要文件传输记录。相信很多朋友都遇到过类似的场景:可能是系统升级后聊天记录不见了&#xf…...

毕设程序java基于的动漫分析与交流平台 基于Spring Boot的二次元文化社区与作品分享系统 Java驱动的ACG内容聚合与互动服务平台

毕设程序java基于的动漫分析与交流平台31sl5luf(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着互联网技术的飞速发展和Z世代文化消费的崛起,动漫产业已从边缘亚文…...

sguard_limit:智能优化游戏体验的系统资源管理工具

sguard_limit:智能优化游戏体验的系统资源管理工具 【免费下载链接】sguard_limit 限制ACE-Guard Client EXE占用系统资源,支持各种腾讯游戏 项目地址: https://gitcode.com/gh_mirrors/sg/sguard_limit 1. 性能瓶颈解析 1.1 游戏玩家的共同困扰…...

Ollama部署Phi-3-mini全攻略:从安装到提问,新手友好图文指南

Ollama部署Phi-3-mini全攻略:从安装到提问,新手友好图文指南 想体验一个轻量级但能力不俗的AI助手吗?今天我们来聊聊如何用最简单的方式,把微软出品的Phi-3-mini模型部署起来,让它帮你写代码、回答问题、甚至进行创意…...

Stable Diffusion显存不够?5个你没想到的省显存技巧(实测可跑24GB模型)

Stable Diffusion显存优化实战:5个突破性技巧释放GPU潜力 当你在深夜赶制商业项目,Stable Diffusion突然弹出"CUDA out of memory"的红色警告,那种绝望感每个AI创作者都懂。我曾在RTX 4090上加载24GB的动漫风格模型时,发…...

如何利用Metabase实现联邦学习驱动的智能数据分析:三步入门指南

如何利用Metabase实现联邦学习驱动的智能数据分析:三步入门指南 【免费下载链接】metabase metabase/metabase: 是一个开源的元数据管理和分析工具,它支持多种数据库,包括 PostgreSQL、 MySQL、 SQL Server 等。适合用于数据库元数据管理和分…...

Java PPT自动化:从数据到演示文稿的智能生成

1. 为什么需要Java PPT自动化? 想象一下这样的场景:每周五下午,市场部的同事都会准时发来一封邮件,要求你根据本周的销售数据生成一份PPT报告。数据来自CRM系统,包含几十个SKU的销售额、增长率、区域分布等信息。你需要…...

WinUtil终极指南:10分钟掌握Windows系统管理与优化工具

WinUtil终极指南:10分钟掌握Windows系统管理与优化工具 【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil WinUtil是一款强大的Windo…...

CentOS 7下Google Chrome离线安装全攻略(附依赖包下载清单)

CentOS 7下Google Chrome离线安装全攻略(附依赖包下载清单) 在企业级Linux环境中,CentOS 7因其稳定性和安全性仍然是许多组织的首选。然而,当需要在隔离网络环境下部署现代浏览器时,依赖关系往往成为技术人员的噩梦。…...

如何在10分钟内掌握SASM:终极汇编语言开发环境完整指南

如何在10分钟内掌握SASM:终极汇编语言开发环境完整指南 【免费下载链接】SASM SASM - simple crossplatform IDE for NASM, MASM, GAS and FASM assembly languages 项目地址: https://gitcode.com/gh_mirrors/sa/SASM SASM(SimpleASM&#xff09…...