当前位置: 首页 > news >正文

Linux Ubuntu20.04深度学习环境快速配置命令记录

一、驱动安装

1、更新系统包

sudo apt-get updatesudo apt-get upgrade

2、安装显卡驱动

使用apt方式安装驱动,多数情况不容易成功,

使用一下方法更佳:

1.查看合适显卡的驱动版本

ubuntu-drivers devices

NVIDIA GeForce 驱动程序 - N 卡驱动 | NVIDIANVIDIA GeForce 驱动程序官方提供下载最新版的 Geforce 驱动程序,可提升 PC 游戏体验和应用程序速度。更多关于更新显卡驱动程序以及显卡驱动程序下载的信息,请访问 NVIDIA 官网。icon-default.png?t=N7T8https://www.nvidia.cn/geforce/drivers/选择合适版本的驱动,下载后直接可以安装

 下载推荐版本

两种方式:①有桌面的,直接双击进行安装。

②命令行:


sudo dpkg -i XXX.deb

2.minicoda 见前面的文章 。Miniconda — conda documentationicon-default.png?t=N7T8https://docs.conda.io/en/latest/miniconda.html#linux-installers

3、安装cuda

查看版本对应

CUDA 12.2 Release Notes — cuda-toolkit-release-notes 12.2 documentationThe Release Notes for the CUDA Toolkit.icon-default.png?t=N7T8https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

查看pytorch版本对应

Previous PyTorch Versions | PyTorchAn open source machine learning framework that accelerates the path from research prototyping to production deployment.icon-default.png?t=N7T8https://pytorch.org/get-started/previous-versions/

安装 11.7版本cuda比较通用

CUDA Toolkit 11.7 Update 1 Downloads | NVIDIA DeveloperResources CUDA Documentation/Release NotesMacOS Tools Training Sample Code Forums Archive of Previous CUDA Releases FAQ Open Source PackagesSubmit a BugTarball and Zip Archive Deliverablesicon-default.png?t=N7T8https://developer.nvidia.com/cuda-11-7-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_local

不要使用network版本安装,它会直接安装最新版本,使用离线安装,两个时间差不多

4、安装cudnn

cuDNN Archive | NVIDIA DeveloperExplore and download past releases from cuDNN GPU-accelerated primitive library for deep neural networks.icon-default.png?t=N7T8https://developer.nvidia.com/rdp/cudnn-archive

主要对应版本,intel 选86_64 , 系统 20.04.只需要下载一个文件,这里和老版本不太一样。同样双击就可以安装。

 最后一把配置环境变量

export PATH="/usr/local/cuda-11.7/bin${PATH:+:${PATH}}"
export LD_LIBRARY_PATH="/usr/local/cuda-11.7/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}"

 torch安装,参考18.04版本

Ubuntu 18.04 深度学习环境快速配置命令记录_瑾怀轩的博客-CSDN博客sudo apt-get install ubuntu-drivers-common #安装。4、在线安装不行,离线安装ok。5、安装miniconda。10、安装cudann。6、初始化conda。https://blog.csdn.net/ckq707718837/article/details/130884384?spm=1001.2014.3001.5502

二、驱动卸载

卸载cuda:

sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \"*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*"

 卸载nvidia驱动

sudo apt-get --purge remove "*nvidia*" "libxnvctrl*"

 卸载不用的依赖包

sudo apt-get autoremove

三、可能会遇到的问题:

问题一、

ERROR: An 
NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel

ERROR: An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel

安装驱动的报错信息为:

ERROR: An NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel.  This may be because it is 
in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if 
your kernel was configured without support for module unloading.  Please be sure to exit any programs that may be us
ing the GPU(s) before attempting to upgrade your driver.  If no GPU-based programs are running, you know that your k
ernel supports module unloading, and you still receive this message, then an error may have occurred that has corrup
ted an NVIDIA kernel module's usage count, for which the simplest remedy is to reboot your computer.
 

or

ERROR: An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel.  This may be because it is 
in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if 
your kernel was configured without support for module unloading.  Please be sure to exit any programs that may be us
ing the GPU(s) before attempting to upgrade your driver.  If no GPU-based programs are running, you know that your k
ernel supports module unloading, and you still receive this message, then an error may have occurred that has corrup
ted an NVIDIA kernel module's usage count, for which the simplest remedy is to reboot your computer.

正常情况:

解决办法如下: 目的是移去kernel中包含NVIDIA的进程,举个栗子:

命令:

lsmod | grep nvidia

nvidia_uvm            995356  2 
nvidia_drm             53134  0 
nvidia_modeset       1195268  1 nvidia_drm
nvidia              35237551  14 nvidia_modeset,nvidia_uvm
drm_kms_helper        179394  2 i915,nvidia_drm
drm                   429744  5 i915,drm_kms_helper,nvidia,nvidia_drm
 

 数字代表依赖进程数量,卸载时,需要重后置位不存在依赖项的开始卸载,比如这里要从

nvidia-smi开始

sudo rmmod nvidia-drm
sudo rmmod nvidia-moddeset
sudo rmmod nvidia

现在再使用:

lsmod | grep nvidia

会发现基本上没有信息了打印了,如何还有,就用上面的命令卸载过程中还会出现意外情况,就是 某个模块被占用,卸载不掉

rmmod: ERROR: Module nvidia_drm is in use

 如果是 nvidia-uvm可以使用top命令,查看进程,kill掉进程,再执行上面步骤。

如果是 nvidia-drm 会发现没在进程中,这是进入无图形化界面

sudo systemctl isolate multi-user.target

这个过程可能黑屏,不用慌张,关机重启,再尝试该操作,登录账号后,同样的操作,

lsmod | grep nvidia
sudo rmmod nvidia-drm

也可以使用下面命令 

sudo modprobe -r nvidia-drm

如果还有其他的一次性卸载完。卸载完后,使用下面命令进入图形化界面

sudo systemctl start graphical.target

进入后 ,检查一下

lsmod | grep nvidia

没有依赖项可以安装了

问题二、安装是要注意版本,安装时注意选项选择

sudo sh NVIDIA-Linux-x86_64-535.42.run -no-x-check -no-nouveau-check -no-opengl-files

 后面可加参数,选择选项,跟着默认项选即可。

这里注意的是,安装32位库会根据显卡版本,修改系统内核。所以在安装前选好版本后,尽量和系统推荐版本,与内核版本保持一致。

查看内核版本

less /proc/version
cat /proc/driver/nvidia/version
ubuntu-drivers devices

安装好后nvidia驱动,使用nvidia-smi如果不需要低版本cuda需求,尽量使用nvidia-smi上面推荐的cuda版本

问题3

Failed to initialize NVML: Driver

这个问题 一般情况重启就能解决, 注意前提

1、安装好显卡驱动

2、安装好cuda和cudnn

3、配置好环境变量

解决办法: 关机 --》开机

如果还解决不了,从头再来,大概率是安装显卡驱动版本选错了,或者提示选项选错了。

相关文章:

Linux Ubuntu20.04深度学习环境快速配置命令记录

一、驱动安装 1、更新系统包 sudo apt-get updatesudo apt-get upgrade 2、安装显卡驱动 使用apt方式安装驱动,多数情况不容易成功, 使用一下方法更佳: 1.查看合适显卡的驱动版本 ubuntu-drivers devices NVIDIA GeForce 驱动程序 - …...

信息安全三级真题一

目录 一、单选题 二、填空题 三、综合题 一、单选题 二、填空题 三、综合题 知法懂法,请各位网络安全从业者遵守《网络安全法》、《个人信息保护法》 业%$务*$&联&#系 XHU3ZjUxXHU3ZWRjXHU4ZmQwXHU3ZWY0XHU2ZTE3XHU5MDBmXHU1NmUyXHU5NjFmXHUyMDBiXHU2M…...

RK3568-tftp更新设备树和内核nfs挂载文件系统

1. 注意:需要设备树和内核按以下修改才能支持tftp和nfs。 1.1 修改设备树: diff --git a/arch/arm64/boot/dts/rockchip/OK3568-C-linux.dts b/arch/arm64/boot/dts/rockchip/OK3568-C-linux.dts index 178b4d831..34cb57ffd 100644 --- a/arch/arm64/boot/dts/rockchip/OK…...

FIR滤波器简述及FPGA仿真验证

数字滤波器的设计,本项目做的数字滤波器准确来说是FIR滤波器。 FIR滤波器(有限冲激响应滤波器),与另一种基本类型的数字滤波器——IIR滤波器(无限冲击响应滤波器)相对应,其实就是将所输入的信号…...

高速信号处理板资料保存:383-基于kintex UltraScale XCKU060的双路QSFP+光纤PCIe 卡设计原理图

基于kintex UltraScale XCKU060的双路QSFP光纤PCIe 卡 一、板卡概述 本板卡系我司自主研发,基于Xilinx UltraScale Kintex系列FPGA XCKU060-FFVA1156-2-I架构,支持PCIE Gen3 x8模式的高速信号处理板卡,搭配两路40G QSFP接口&#xf…...

QT:使用分组框、单选按钮、普通按钮、标签、行编辑器、垂直分布、水平分布做一个小项目

widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QRadioButton> //单选按钮 #include <QGroupBox> //分组框 #include <QHBoxLayout> //水平布局 #include <QVBoxLayout> //垂直布局 #include <QPushButton>…...

封装微信小程序隐私信息授权

隐私 代码 html &#xff08;modal 组件再后面封装有提供&#xff09; <modal isShow"{{show}}"><view class"privacy-auth-dialog"><view class"title">温馨提示</view><view class"content"><vi…...

【C#】FileInfo类 对文件进行操作

提示&#xff1a;使用FileInfo类时&#xff0c;要引用System.IO命名空间。 using System.IO; FileInfo类 生成文件删除文件移动文件复制文件获取文件名判断文件是否存在属性列表其它常用方法 生成文件 Create()&#xff1a;在指定路径上创建文件。 FileInfo myFile new FileIn…...

python中的字符串也是可迭代对象吗?

python中的字符串也是可迭代对象吗&#xff1f; ━━━━━━━━━━━━━━━━━━━━━━   是的&#xff0c;Python中的字符串是可迭代对象。这意味着你可以像处理列表或元组那样处理字符串。例如&#xff0c;你可以使用for循环遍历字符串中的每个字符&#xff0c;或…...

C++ 图像线特征提取【HoughLinesP算法】

目录 一、函数介绍二、实现步骤三、代码示例一、函数介绍 HoughLinesP:是一种基于Hough变换的直线检测算法。它可以识别图像中的直线,并返回它们的端点坐标。其函数接口如下: cv::HoughLinesP(   InputArray src,   // 输入图像,必须 8-bit 的灰度图像   OutputArray…...

Stable Diffusion WebUI内存不够爆CUDA Out of memory怎么办?

在我们运行SD的时候,我们经常会爆CUDA Out of memory。 我们应该怎么办呢? 这是因为我们的显存或者内存不够了。 如果你是用cpu来跑图的则表示内存不够,这个时候就需要换个大点的内存了。 如果你是用gpu来跑图的就说明你显存不够用咯,这时候咋办呢? 下面我将一一述说…...

模板学堂|数据可视化仪表板大屏设计流程梳理

DataEase开源数据可视化分析平台于2022年6月正式发布模板市场&#xff08;https&#xff1a;//dataease.io/templates/&#xff09;。模板市场旨在为DataEase用户提供专业、美观、拿来即用的仪表板模板&#xff0c;方便用户根据自身的业务需求和使用场景选择对应的仪表板模板&a…...

基于Xml方式Bean的配置-Bean的延时加载

SpringBean的配置详解 Bean的延时加载 当lazy-init设置为true时为延时加载&#xff0c;也就是当Spring容器创建的时候&#xff0c;不会立即创建Bean实例&#xff0c;等待用到时再创建Bean实例并储存到单例池中&#xff0c;后续使用该Bean时直接从单例池中获取即可&#xff0c;…...

python之pyQt5实例:Matplotlib的应用

1、显示逻辑 1.1MatplotlibWidget.py import sys import random import matplotlibmatplotlib.use("Qt5Agg") from PyQt5 import QtCore from PyQt5.QtWidgets import QApplication, QMainWindow, QVBoxLayout, QSizePolicy, QWidget from numpy import arange, si…...

智囊AI-基于 ChatGPT 的 AI 工具产品 你的私人AI助手

智囊AI是一款基于 ChatGPT 的 AI 工具产品&#xff0c;主打免费、智能、方便&#xff0c;可以在此雇佣各种各样的免费智囊进行对话、自己创造和分享智囊、共享有趣有用的对话等。不过使用需要注册登录&#xff0c;可以使用自己的openai key或者使用网站提供的api key&#xff0…...

nginx配置vue前端代理

背景&#xff1a;做一个前后端分离的项目&#xff0c;我这里是vue3 view ts创建的前端项目&#xff0c;在前端配置跨域请求。 一、开发阶段 在vue.config.js中配置devserver的proxy进行代理请求配置&#xff0c;然后将所有请求改为/api开头的即可。但是这样配置只在开发阶段…...

【C语言】【数据存储】用%u打印char类型?用char存128?

1.题目一&#xff1a; #include <stdio.h> int main() {char a -128;printf("%u\n",a);return 0; }%u 是打印无符号整型 解题逻辑&#xff1a; 1. 原反补互换&#xff0c;截断 -128 原码&#xff1a;10000000…10000000 补码&#xff1a;11111111…10000000…...

git-git命令汇总

1.git 存储永久凭据 git config --global credential.helper store 2.git 查询分支或标签的引用 git show-ref 【标签名|分支名】 3.git 搜索关键分支和tag git tag -l *branch* --sortcommitterdate 4.git 删除标签 git tag -d v1.32 删除标签v1.32&#xff0c;参数d…...

自定义实现简易版ArrayList

文章目录 1.了解什么是顺序表2.实现哪些功能3.初始化ArrayList4.实现功能接口遍历顺序表判断顺序表是否已满添加元素指定下标添加元素自定义下标不合法异常判断顺序表是否为空查找指定元素是否存在查找指定元素返回下标获取指定下标的元素顺序表为空异常修改指定下标元素的值删…...

React中的Hooks--useReducer()

首先&#xff0c;useReducer是React提供的一个钩子函数&#xff0c;用于管理组件内部的状态。它可以接收一个reducer函数和初始状态&#xff0c;并返回一个包含状态和更新状态的函数的数组。 与之相反&#xff0c;Redux是一个独立的状态管理库&#xff0c;它可以在整个应用程序…...

PX4 OFFBOARD模式实战:手把手教你用C++代码让无人机自主起飞(附心跳包避坑指南)

PX4 OFFBOARD模式深度实战&#xff1a;从心跳包机制到三维轨迹控制的完整实现 当你的无人机在OFFBOARD模式下突然失控坠落&#xff0c;或者莫名其妙地退出自主控制模式时&#xff0c;是否曾怀疑过自己的代码逻辑&#xff1f;这些问题往往源于对PX4底层通信机制理解不够深入。本…...

信号分析避坑指南:MATLAB里算相位差,为什么你的结果总是不准?

MATLAB相位差计算避坑指南&#xff1a;从频谱泄漏到四象限陷阱的深度解析 在信号处理领域&#xff0c;相位差计算看似简单却暗藏玄机。许多工程师在使用MATLAB进行相位差分析时&#xff0c;经常会遇到结果跳变、误差过大甚至完全不符合预期的情况。这并非MATLAB的"bug&quo…...

Qwen3-TTS-Tokenizer-12Hz实操手册:音频峰值检测与动态范围压缩联动

Qwen3-TTS-Tokenizer-12Hz实操手册&#xff1a;音频峰值检测与动态范围压缩联动 1. 引言&#xff1a;音频处理的关键挑战 音频处理中经常遇到两个棘手问题&#xff1a;一是音频信号动态范围过大导致某些部分听不清&#xff0c;二是峰值过高造成失真。传统方法需要分别处理这两…...

告别阿里云!用ThingsCloud免费搭建个人智能家居控制中心(附ESP8266配置)

从零构建智能家居控制中心&#xff1a;ThingsCloud与ESP8266实战指南 在智能家居领域&#xff0c;许多技术爱好者常常面临一个两难选择&#xff1a;要么使用功能强大但配置复杂的商业平台&#xff0c;要么选择简单但功能有限的DIY方案。ThingsCloud的出现为这一问题提供了优雅的…...

STM32实战:为小米CyberGear/灵足电机构建机械限位零点与位置模式正弦轨迹

1. 小米CyberGear电机零点丢失问题解析 第一次用小米CyberGear电机做项目时&#xff0c;我就被它断电后零点丢失的问题坑得不轻。早上调好的机械臂&#xff0c;下午上电就歪了30度&#xff0c;这种体验相信很多开发者都遇到过。这其实是大多数伺服电机的通病——断电后编码器位…...

OptiScaler终极指南:3步解锁跨平台超分辨率技术,让所有显卡享受DLSS级画质提升

OptiScaler终极指南&#xff1a;3步解锁跨平台超分辨率技术&#xff0c;让所有显卡享受DLSS级画质提升 【免费下载链接】OptiScaler DLSS replacement for AMD/Intel/Nvidia cards with multiple upscalers (XeSS/FSR2/DLSS) 项目地址: https://gitcode.com/GitHub_Trending/…...

VS2022社区版离线安装后,真的不用登录吗?我的30天实测与长期使用避坑指南

VS2022社区版离线安装后长期免登录实战指南&#xff1a;破解30天授权谜题 第一次在完全离线的开发环境中双击VS2022图标时&#xff0c;那种忐忑感记忆犹新——这个号称"免费"的开发工具&#xff0c;会不会突然弹出登录框锁死我的工作流&#xff1f;微软官方文档对离线…...

Qwen3-VL-2B离线运行实测:无需联网,本地搭建视觉对话机器人

Qwen3-VL-2B离线运行实测&#xff1a;无需联网&#xff0c;本地搭建视觉对话机器人 1. 引言 在当今AI技术快速发展的时代&#xff0c;视觉语言模型(Vision-Language Model)正逐渐从云端走向本地。Qwen3-VL-2B-Instruct作为一款轻量级多模态模型&#xff0c;能够在普通电脑上实…...

WeKnora镜像免配置教程:支持知识库版本管理与灰度问答切换机制

WeKnora镜像免配置教程&#xff1a;支持知识库版本管理与灰度问答切换机制 1. 引言&#xff1a;告别AI幻觉&#xff0c;让知识问答精准可控 你有没有遇到过这种情况&#xff1f;你给AI看了一份产品说明书&#xff0c;然后问它一个具体参数&#xff0c;结果它回答得头头是道&a…...

OpenClaw多任务测试:Qwen3-32B在RTX4090D上的并发表现

OpenClaw多任务测试&#xff1a;Qwen3-32B在RTX4090D上的并发表现 1. 测试背景与实验设计 去年冬天第一次接触OpenClaw时&#xff0c;我就被它的"多线程任务调度"特性吸引。作为一个经常需要同时处理文件整理、邮件发送和截图识别的开发者&#xff0c;这种能力理论…...