当前位置: 首页 > article >正文

Ubuntu24.04 NVIDIA驱动安装 nvidia-smi报错及修复

Ubuntu24.04 NVIDIA驱动安装 nvidia-smi报错及修复Ubuntu24.04 安装 NVIDIA 595 驱动显示已最新但 nvidia-smi 无法通信报错完美解决一、环境说明显卡NVIDIA GeForce RTX 4080系统Ubuntu 24.04 LTS二、错误全过程复现1. 手动安装推荐驱动先查看系统推荐显卡驱动ubuntu-drivers devices输出vendor : NVIDIA Corporation model : AD103 [GeForce RTX 4080] driver : nvidia-driver-595-open - distro non-free driver : nvidia-driver-580-open - distro non-free driver : nvidia-driver-535 - distro non-free driver : nvidia-driver-595-server - distro non-free driver : nvidia-driver-595 - distro non-free recommended driver : nvidia-driver-595-server-open - distro non-free driver : nvidia-driver-580 - distro non-free driver : nvidia-driver-535-server-open - distro non-free driver : nvidia-driver-535-open - distro non-free driver : nvidia-driver-535-server - distro non-free driver : nvidia-driver-580-server - distro non-free driver : nvidia-driver-580-server-open - distro non-free driver : xserver-xorg-video-nouveau - distro free builtin看到nvidia-driver-595 为系统推荐版本于是执行手动安装sudoaptupdatesudoaptinstallnvidia-driver-595安装日志正在读取软件包列表... 完成 正在分析软件包的依赖关系树... 完成 正在读取状态信息... 完成 nvidia-driver-595 已经是最新版 (595.58.03-0ubuntu0.24.04.1)。 下列软件包是自动安装的并且现在不需要了 libboost-iostreams1.83.0 libfcitx5-qt-data ... 使用sudo apt autoremove来卸载它(它们)。 升级了 0 个软件包新安装了 0 个软件包要卸载 0 个软件包有 347 个软件包未被升级。表面看驱动已安装且是最新版以为没问题。2. 执行 nvidia-smi 直接报错nvidia-smi报错信息NVIDIA-SMI has failed because it couldnt communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.3. 查看显卡硬件是否识别lspci|grep-invidia输出01:00.0 VGA compatible controller: NVIDIA Corporation AD103 [GeForce RTX 4080] (rev a1) 01:00.1 Audio device: NVIDIA Corporation Device 22bb (rev a1)硬件正常识别不是显卡硬件问题。4. 查看内核驱动模块无输出lsmod|grepnvidia无任何输出说明 NVIDIA 内核模块根本没加载。5. 手动加载模块报错sudomodprobe nvidia报错modprobe: FATAL: Module nvidia not found in directory /lib/modules/6.17.0-14-generic核心问题驱动没给当前内核编译对应模块。三、问题根因直接apt install nvidia-driver-595虽然装了驱动包但缺少对应内核头文件DKMS 无法自动编译内核模块当前内核6.17.0-14-generic没有匹配的 nvidia 内核模块系统找不到驱动旧驱动残留、nouveau 开源驱动冲突也会导致驱动无法正常加载。四、完整修复步骤逐条复制执行步骤1安装当前内核匹配的内核头文件关键sudoaptinstalllinux-headers-$(uname-r)步骤2彻底卸载所有NVIDIA旧驱动及依赖sudoaptpurge nvidia-* libnvidia-*sudoaptautoremovesudoaptclean步骤3安装DKMS内核模块编译工具sudoaptinstalldkms步骤4系统自动适配显卡内核安装最优驱动sudoubuntu-drivers autoinstall步骤5重启生效sudoreboot五、重启后验证成功重启后执行nvidia-smi正常输出Wed May 6 11:19:13 2026 ----------------------------------------------------------------------------------------- | NVIDIA-SMI 595.58.03 Driver Version: 595.58.03 CUDA Version: 13.2 | --------------------------------------------------------------------------------------- | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | || | 0 NVIDIA GeForce RTX 4080 Off | 00000000:01:00.0 On | N/A | | 33% 38C P0 27W / 320W | 78MiB / 16376MiB | 0% Default | | | | N/A | --------------------------------------------------------------------------------------- ----------------------------------------------------------------------------------------- | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | || | 0 N/A N/A 1534 G /usr/lib/xorg/Xorg 39MiB | | 0 N/A N/A 1727 G /usr/bin/gnome-shell 11MiB | -----------------------------------------------------------------------------------------驱动、显卡、CUDA 全部正常。六、避坑总结不要直接apt install nvidia-driver-xxx就完事极易出现驱动已装但内核模块缺失出现Module nvidia not found就是缺少内核头文件、未编译驱动模块Ubuntu 装 N 卡驱动最佳方式用ubuntu-drivers autoinstall自动适配内核和显卡联想工作站若仍异常进 BIOS 关闭Secure Boot 安全启动即可一定要先清旧驱动残留再重装避免版本冲突。

相关文章:

Ubuntu24.04 NVIDIA驱动安装 nvidia-smi报错及修复

Ubuntu24.04 NVIDIA驱动安装 nvidia-smi报错及修复 Ubuntu24.04 安装 NVIDIA 595 驱动显示已最新但 nvidia-smi 无法通信报错完美解决 一、环境说明 显卡:NVIDIA GeForce RTX 4080系统:Ubuntu 24.04 LTS二、错误全过程复现 1. 手动安装推荐驱动 先查看系…...

AISMM不是ISO替代品——20年信息治理专家拆解其不可替代的7层风控价值

更多请点击: https://intelliparadigm.com 第一章:SITS2026圆桌:AISMM的全球推广 在2026年新加坡国际技术峰会(SITS2026)上,AISMM(AI-Driven Software Maturity Model)正式成为全球…...

从开发者视角感受 Taotoken 标准协议接入的便捷性与低延迟

从开发者视角感受 Taotoken 标准协议接入的便捷性与低延迟 1. 迁移背景与动机 在构建基于大语言模型的应用程序时,开发者常常需要对接多个模型供应商的 API。这通常意味着需要维护多套 SDK 配置、处理不同的认证方式,并在代码中根据供应商切换请求地址…...

Cloudflare Workers邮件路由:零成本实现自定义域名邮箱转发

1. 项目概述:一个基于Cloudflare Workers的邮件路由神器如果你手头有几个域名,或者想为你的个人项目、博客、小工具创建独立的联系邮箱,但又不想花钱购买企业邮箱服务,更不想在服务器上折腾复杂的Postfix或Sendmail,那…...

如何通过多模态AI构建智能视频内容解析系统:video-analyzer技术深度解析

如何通过多模态AI构建智能视频内容解析系统:video-analyzer技术深度解析 【免费下载链接】video-analyzer Analyze videos using LLMs, Computer Vision and Automatic Speech Recognition 项目地址: https://gitcode.com/gh_mirrors/vi/video-analyzer 在视…...

AI网关与可观测性平台Helicone:统一管理LLM请求,实现成本与性能优化

1. 项目概述:为什么我们需要一个AI网关与可观测性平台?如果你正在开发基于大语言模型的应用,无论是构建一个智能客服、一个代码助手,还是一个复杂的多智能体系统,你大概率会遇到下面这些让人头疼的问题:成本…...

OpenClaw智能诊断工具oc-doctor:自动化运维与AI助手健康管理

1. 项目概述:一个为OpenClaw量身定制的“家庭医生”如果你正在使用OpenClaw或Claude Code来构建自己的AI助手或自动化工作流,那么你很可能已经体会过那种“半夜救火”的滋味。配置文件里某个参数不小心改错了,导致机器人行为异常;…...

浪潮云洲×摩尔元数达成战略合作,以工业AI赋能区域数字产业发展

近日,在第九届数字中国建设峰会“人工智能助力产业数智化转型与提升政府效能研讨会”上,浪潮集团旗下浪潮云洲携手摩尔元数、泰山新基建、平顶山交水建投、青岛城投数科、山东鲁开、金通数字、甘肃弱水新能源等进行集中签约,聚焦区域数字产业…...

保姆级教程:在YOLOv5 6.x中手搓C3GC模块,从代码修改到训练调参的全流程记录

从零构建YOLOv5 6.x的C3GC模块:代码实现与调参实战全解析 在目标检测领域,YOLOv5凭借其出色的速度和精度平衡成为工业界和学术界的宠儿。但当我们面对特定场景时,原版模型的特征提取能力可能仍有提升空间。本文将带你深入探索如何通过引入全局…...

Python requests库调用公司接口报SSL版本错误?别急着改代码,先检查这个隐藏的‘元凶’

Python requests库SSL版本错误的隐秘陷阱:当抓包工具成为"元凶" 调试Python脚本时遇到SSLError(1, [SSL: WRONG_VERSION_NUMBER])错误,很多开发者会本能地检查代码中的SSL验证设置或服务器配置。但今天我要分享的这个案例,问题根源…...

Doramagic:基于Python的图像处理自动化工具集设计与实践

1. 项目概述:一个面向图像处理的“魔法”工具集最近在GitHub上闲逛,发现了一个名为“Doramagic”的项目,作者是tangweigang-jpg。光看这个名字,就挺有意思的——“Dora”让人联想到那个充满好奇心和冒险精神的动画角色&#xff0c…...

mysql5.7开启主从配置

一、 环境准备与前置检查 两台服务器(或虚拟机)均安装 MySQL 5.7,版本建议保持一致。 确保主从库之间 3306 端口互通(关闭防火墙或放行端口)。 如果是克隆的虚拟机,务必检查 /var/lib/mysql/auto.cnf中的 s…...

网络安全学习指南:从零基础到进阶的完整路径(附资源包,建议收藏)

一、网络安全的概念与重要性 网络安全(Cyber Security)是指网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或者恶意的原因而遭受到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。网络安全不仅…...

运维工程师必看!我从11K到20K的网络安全转型之路,收藏这篇避免35岁危机

凌晨 1 点,我蹲在机房地上接服务器电源线,后背被空调外机吹得发凉。手机里老板的消息还在跳:“客户数据丢了,天亮前恢复不了你就别来了。” 那是我做运维的第 8 年,手里攥着 11K 的薪资条,看着监控屏上闪烁…...

Obsidian Tasks 终极指南:6个优先级符号让任务管理效率提升300%

Obsidian Tasks 终极指南:6个优先级符号让任务管理效率提升300% 【免费下载链接】obsidian-tasks Task management for the Obsidian knowledge base. 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-tasks Obsidian Tasks 是 Obsidian 知识库中功能…...

【干货收藏】网络安全岗位完全指南:从零开始了解行业需求与职业发展

网络安全被列为国家安全战略的一部分,安全行业规模逐渐扩大,网安人员的需求也随之增加。很多刚转行过来的新同学,对网络安全岗位了解还比较少,今天明叔给大家讲一下网络安全行业都有哪些岗位以及职责要求,我们一起来看…...

PiliPlus实战手册:解锁纯净跨平台B站观影体验

PiliPlus实战手册:解锁纯净跨平台B站观影体验 【免费下载链接】PiliPlus PiliPlus 项目地址: https://gitcode.com/gh_mirrors/pi/PiliPlus 在广告泛滥、体验割裂的官方客户端之外,一个基于Flutter开发的跨平台B站客户端PiliPlus正悄然改变你的观…...

w3x2lni:魔兽地图跨版本转换的完整解决方案

w3x2lni:魔兽地图跨版本转换的完整解决方案 【免费下载链接】w3x2lni 魔兽地图格式转换工具 项目地址: https://gitcode.com/gh_mirrors/w3/w3x2lni 魔兽争霸III地图开发者在面对不同游戏版本时常常陷入技术困境——从经典的1.24.4到现代的1.32.8&#xff0c…...

YOLO-World实战:手把手教你用‘先提示后检测’策略,把实时开放词汇检测部署到边缘设备

YOLO-World边缘部署实战:从模型压缩到推理加速的全链路优化 在边缘计算设备上部署开放词汇物体检测模型一直是计算机视觉工程师面临的挑战。YOLO-World的出现改变了这一局面——它既保留了YOLO系列实时检测的特性,又突破了传统检测模型固定类别限制。但真…...

Nginx HTTPS 负载均衡的正确打开方式:低成本实现HTTPS负载均衡的Nginx方案

先说结论 你不需要买昂贵的硬件负载均衡器。 一台装了 Nginx 的服务器 + 一张免费的 Let’s Encrypt 证书,就能搞定 HTTPS 负载均衡。零成本、高可用、还能自动故障转移。 这不是"能用就行"的玩具方案,这是全球超过 3 亿网站的生产级选择。 这个东西是什么(用类…...

Cursor Free VIP:三步解锁AI编程助手Pro功能完整指南

Cursor Free VIP:三步解锁AI编程助手Pro功能完整指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your tria…...

数据原生流动技术:让AI与控制系统“零延迟握手“

CSDN标签:工业AI 数据原生 云原生 零信任 中控UCS 数据集成 引言:当数据遇上"早高峰" 想象一下,你每天上班必经的那条主干道——平时畅通无阻,一到早高峰就水泄不通。数据在工厂里流动也是如此。 传统的数据集成方案就像用马车在高速公路上运快递:数据从传感器…...

低预算外贸独立站的工程化交付:模板复用、服务器打包与5天上线流程

低预算外贸独立站(3,000-5,000 元区间)在企业建站市场占比超过 30%。行业内一些把这个细分领域工程化做到位的团队(如北京乐兮创想科技等)已经将3000元外贸建站作为标准化产品包交付,但这个细分领域的工程化程度普遍很…...

优学宝在线课程小程序正式上线!主打多元化在线课程模式,涵盖视频、音频、图文、专题四大课程类型,全品类内容全覆盖,随时随地在线学习,一站式高效提升自我。

官网链接:https://youxuebao.com.cn 管理后台演示地址:https://demoadmin.youxuebao.com.cn/admin 商户后台演示地址:https://demomanage.youxuebao.com.cn/platform 前端演示地址:https://demo.youxuebao.com.cn 演示账号&am…...

加入收藏!小白程序员也能抓住的AI高薪机遇,大厂都在布局!

近期大厂纷纷成立AI部门,加大对AI的投入,预示AI已成为核心发展方向。AI技术正渗透工作生活,带来大量高薪岗位机会。无论技术岗或非技术岗,AI大模型应用开发等岗位年薪可达70万。AI岗位薪资高因需求大、供给少。随着AI技术成熟&…...

基于Kubeadm与Ansible的Kubernetes集群自动化部署实战

1. 项目概述:一个基于 Kubeadm 和 Ansible 的“开箱即用”Kubernetes 集群部署方案 如果你正在寻找一种方法,能够快速、可靠地在自己的物理机、虚拟机甚至云主机上部署一个功能完整的生产级 Kubernetes 集群,并且厌倦了手动执行 kubeadm ini…...

小米手表表盘制作神器:3步搞定个性化设计,无需任何编程基础

小米手表表盘制作神器:3步搞定个性化设计,无需任何编程基础 【免费下载链接】Mi-Create Unofficial watchface creator for Xiaomi wearables ~2021 and above 项目地址: https://gitcode.com/gh_mirrors/mi/Mi-Create 你是不是也曾为小米手表上单…...

创业团队如何利用 Taotoken 统一管理多个大模型 API 成本

创业团队如何利用 Taotoken 统一管理多个大模型 API 成本 对于小型创业团队而言,快速迭代产品、验证想法是核心任务,这常常意味着需要灵活调用不同能力的大模型。然而,直接对接多家模型厂商会带来一个现实的工程与财务问题:每个服…...

《继承者》

《继承者》 下部:星空与尘埃 楔子:千年之后 3163年,银河系猎户臂,人类联邦档案馆。 “这就是你说的‘起源’?” 一个孩子站在全息投影前,仰头看着一颗蓝白相间的星球。它的海洋还在,它的云层还在…...

轻量级配置切换工具cc-switch:多环境配置管理实践

1. 项目概述:一个轻量级的配置切换工具在软件开发、运维部署乃至日常的自动化脚本编写中,我们经常会遇到一个看似简单却颇为恼人的问题:如何在不同环境(如开发、测试、生产)或不同场景下,快速、准确、无感地…...