当前位置：首页 > news >正文

CentOS 7.9安装NVIDIA P40显卡驱动、CUDA和cuDNN

news 2026/2/9 5:13:36

文章目录

1、安装P40显卡驱动
- 1.1 查看机器上有哪些显卡
- 1.2 禁用nouveau
- 1.3 安装依赖
- 1.4 安装驱动
2、安装CUDA
- 2.1 安装
- 2.2 测试是否安装成功
3、安装cuDNN
- 3.1 安装
- 3.2 测试是否安装成功
4、总结

1、安装P40显卡驱动

1.1 查看机器上有哪些显卡

lspci | grep -i vga
lspci | grep -i nvidia

在这里插入图片描述

1.2 禁用nouveau

nouveau是N卡的开源驱动，linux会自动安装，不是NVIDIA官方的，安装官方驱动前需先禁止掉它。
执行

lsmod | grep nouveau

如果有输出，说明未禁用；如果没有输出，说明已禁用。
如果未禁用则执行如下操作：

vim /usr/lib/modprobe.d/dist-blacklist.conf

注释掉 blacklist nvidiafb 这一行，然后添加下面两行：

blacklist nouveau
options nouveau modeset=0

然后重建initramfs image，执行下面的命令：

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img
dracut /boot/initramfs-$(uname -r).img $(uname -r)

重启系统：

reboot

再执行：

lsmod | grep nouveau

在这里插入图片描述

如果没有输出，说明已禁用。

1.3 安装依赖

yum install kernel-devel kernel-headers gcc dkms gcc-c++

可能出现问题的解决（是因为我安装了anaconda3引起的）

(base) [root@clang ~]# yum install kernel-devel kernel-headers gcc dkms gcc-c++
There was a problem importing one of the Python modules
required to run yum. The error leading to this problem was:/home/anaconda3/lib/liblzma.so.5: version `XZ_5.1.2alpha' not found (required by /lib64/librpmio.so.3)Please install a package which provides this module, or
verify that the module is installed correctly.It's possible that the above module doesn't match the
current version of Python, which is:
2.7.5 (default, Jun 20 2023, 11:36:40) 
[GCC 4.8.5 20150623 (Red Hat 4.8.5-44)]If you cannot solve this problem yourself, please go to 
the yum faq at:http://yum.baseurl.org/wiki/Faq

找了一些方案是做软链接，但是这个问题修复之后，还会出现其他库找不到的情况。这时简单的处理方法就是先卸载anaconda3，安装完之后再重装上。

1.4 安装驱动

官方下载页，根据你的显卡型号搜索。我的显卡是Tesla P4，用的是CUDA 11.2，所以这是我的型号的下载链接。
在这里插入图片描述
下载完后执行：

chmod +x NVIDIA-Linux-x86_64-460.106.00.run
./NVIDIA-Linux-x86_64-460.106.00.run --kernel-source-path=/usr/src/kernels/3.10.0-1160.83.1.el7.x86_64 -no-x-check --no-opengl-files
# --kernel-source-path的值是装完依赖后才有这个路径
# 远程安装会检测x server，要让它不检测
# 不安装opengl,因为安装opengl,CentOS界面UI不能正常启动

–kernel-source-path=/usr/src/kernels/3.10.0-1160.83.1.el7.x86_64 参数的路径需要根据自己内核的目录来修改

安装过程中

Would you like to register the kernel module sources with DKMS? 选yes(服务器选yes，本地选no)

Install NVIDIA’s 32-bit compatibility libraries? 选yes

安装完成后执行：

nvidia-smi

如果有输出，说明驱动已安装。
在这里插入图片描述

安装过程中可能出现异常的解决
在安装驱动的过程中，我遇到了找不到内核的问题，这时可以通过yum命令安装相应内核来解决，可能用到的命令（需根据自己报错来修改内核版本名称）

sudo yum install linux-headers-3.10.0-1160.92.1.el7.x86_64
sudo yum install kernel-devel-3.10.0-1160.92.1.el7.x86_64

2、安装CUDA

2.1 安装

官方下载页，我下载的是11.2.2的run版本。

chmod +x cuda_11.2.2_460.32.03_linux.run
./cuda_11.2.2_460.32.03_linux.run --no-opengl-libs

安装时，X表示选中，即安装，空白表示不选中，即不安装。驱动前面已经安装了，不用再安装。设成下面的样子，再Install。

CUDA Installer
- [ ] Driver[ ] 460.32.03
+ [X] CUDA Toolkit 11.2[X] CUDA Samples 11.2[X] CUDA Demo Suite 11.2[X] CUDA Documentation 11.2OptionsInstall

安装完后配置环境变量：

vim /etc/profile
# 添加下面两行，路径要和上图中一样
export PATH=/usr/local/cuda-11.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64:$LD_LIBRARY_PATH# 保存并重新加载
source /etc/profile

2.2 测试是否安装成功

终端输入cuda并连按两次tab，若有候选命令，则再执行nvcc --version，有输出版本信息就是安装成功。
在这里插入图片描述

3、安装cuDNN

3.1 安装

官方下载页，在页面内下载针对前面匹配的11.x版本，下载时会提示登录NVIDIA账号，注册账号并登录就可以下载了，下载后执行下面的命令：

tar -xvf cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
# 以下三行命令from https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html
# 参考链接中这一步复制的文件和官方文档中不太一样
cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

3.2 测试是否安装成功

新建一个cudnn_test.cu文件：

#include <stdio.h>
#include <stdlib.h>
#include <cuda_runtime.h>
#include <cudnn.h>#define CHECK_CUDA_ERROR(call) { \cudaError_t error = call; \if (error != cudaSuccess) { \printf("CUDA error: %s, line %d\n", cudaGetErrorString(error), __LINE__); \exit(1); \} \
}#define CHECK_CUDNN_ERROR(call) { \cudnnStatus_t status = call; \if (status != CUDNN_STATUS_SUCCESS) { \printf("CUDNN error: %s, line %d\n", cudnnGetErrorString(status), __LINE__); \exit(1); \} \
}void initialize(float *matrix, int size) {for (int i = 0; i < size; ++i) {matrix[i] = rand() / (float)RAND_MAX; // Initialize with random values}
}int main() {const int N = 1024; // Matrix sizeconst int K = 1024;const int M = 1024;// Allocate memory on hostfloat *A = (float*)malloc(N * K * sizeof(float));float *B = (float*)malloc(K * M * sizeof(float));float *C = (float*)malloc(N * M * sizeof(float));// Initialize matricesinitialize(A, N * K);initialize(B, K * M);// Allocate memory on devicefloat *d_A, *d_B, *d_C;CHECK_CUDA_ERROR(cudaMalloc(&d_A, N * K * sizeof(float)));CHECK_CUDA_ERROR(cudaMalloc(&d_B, K * M * sizeof(float)));CHECK_CUDA_ERROR(cudaMalloc(&d_C, N * M * sizeof(float)));// Copy data from host to deviceCHECK_CUDA_ERROR(cudaMemcpy(d_A, A, N * K * sizeof(float), cudaMemcpyHostToDevice));CHECK_CUDA_ERROR(cudaMemcpy(d_B, B, K * M * sizeof(float), cudaMemcpyHostToDevice));// Create CUDNN contextcudnnHandle_t cudnn;CHECK_CUDNN_ERROR(cudnnCreate(&cudnn));// Define tensor descriptorscudnnTensorDescriptor_t descA, descB, descC;CHECK_CUDNN_ERROR(cudnnCreateTensorDescriptor(&descA));CHECK_CUDNN_ERROR(cudnnCreateTensorDescriptor(&descB));CHECK_CUDNN_ERROR(cudnnCreateTensorDescriptor(&descC));CHECK_CUDNN_ERROR(cudnnSetTensor4dDescriptor(descA, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, 1, N, K, 1));CHECK_CUDNN_ERROR(cudnnSetTensor4dDescriptor(descB, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, 1, K, M, 1));CHECK_CUDNN_ERROR(cudnnSetTensor4dDescriptor(descC, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, 1, N, M, 1));// Define convolution descriptors (in this case, it's just matrix addition)cudnnOpTensorDescriptor_t opDesc;CHECK_CUDNN_ERROR(cudnnCreateOpTensorDescriptor(&opDesc));CHECK_CUDNN_ERROR(cudnnSetOpTensorDescriptor(opDesc, CUDNN_OP_TENSOR_ADD, CUDNN_DATA_FLOAT, CUDNN_NOT_PROPAGATE_NAN));// Perform the operationfloat alpha = 1.0f;float beta = 0.0f;CHECK_CUDNN_ERROR(cudnnOpTensor(cudnn, opDesc, &alpha, descA, d_A, &alpha, descB, d_B, &beta, descC, d_C));// Copy the result back to hostCHECK_CUDA_ERROR(cudaMemcpy(C, d_C, N * M * sizeof(float), cudaMemcpyDeviceToHost));// CleanupcudaFree(d_A);cudaFree(d_B);cudaFree(d_C);cudnnDestroyTensorDescriptor(descA);cudnnDestroyTensorDescriptor(descB);cudnnDestroyTensorDescriptor(descC);cudnnDestroyOpTensorDescriptor(opDesc);cudnnDestroy(cudnn);free(A);free(B);free(C);printf("Operation completed successfully.\n");return 0;
}

编译：

nvcc -o cudnn_test cudnn_test.cu -lcudnn

执行：

./cudnn_test

4、总结

至此显卡驱动、CUDA和cuDNN就安装完成了，安装过程中主要是禁用开源显卡驱动和操作系统内核版本的匹配安装。

提示：更多内容可以访问Clang’s Blog：https://www.clang.asia

CentOS 7.9安装NVIDIA P40显卡驱动、CUDA和cuDNN

文章目录 1、安装P40显卡驱动1.1 查看机器上有哪些显卡1.2 禁用nouveau1.3 安装依赖1.4 安装驱动 2、安装CUDA2.1 安装2.2 测试是否安装成功 3、安装cuDNN3.1 安装3.2 测试是否安装成功 4、总结 1、安装P40显卡驱动 1.1 查看机器上有哪些显卡 lspci | grep -i vga lspci | gr…...

编程日记 2024/5/25 18:39:03

SpringBoot多数据源启动出现循环依赖问题

在使用SpringBoot的项目中，如果是有使用多数据源，可能会存在启动时数据源循环依赖的报错，是因为使用了多数据源注入，和DataSourceAutoConfiguration数据源自动配置的DataSourceInitializerInvoker互相产生循环依赖导致。这种错误…...

编程日记 2024/5/25 18:38:02

【一步一步了解Java系列】：何为数组，何为引用类型

看到这句话的时候证明：此刻你我都在努力加油陌生人个人主页：Gu Gu Study专栏：一步一步了解Java 喜欢的一句话： 常常会回顾努力的自己，所以要为自己的努力留下足迹喜欢的话可以点个赞谢谢了。数组数组是一推相同数据…...

编程日记 2024/5/25 18:37:00

2024年5月份最新独角数卡使用USDT详细小白教程

直观配套视频教程 2024年5月份最新独角数卡安装及USDT使用详细小白教程 1、创建服务器 Centos或者Ubuntu2、宝塔面板开心版安装寶塔 Linux 面版 8.0.5 開心版 - 2024年1月12日 - 开心专区 - 异次元 - Powered by Discuz!Centos安装命令（默认安装是 8.0.1 直接在线升…...

编程日记 2024/5/25 18:35:59

【idea】idea2024最新版本下载_安装_破解

1、下载下载地址：下载 IntelliJ IDEA – 领先的 Java 和 Kotlin IDE 下载完成： idea破解脚本下载链接：https://pan.baidu.com/s/1L5qq26cRABw8XuEn_CngKQ 提取码：6666 下载完成： 2、安装 1、双击idea的安装包&…...

编程日记 2024/5/25 18:34:58

部署CNI网络组件+k8s多master集群部署+负载均衡

一、环境部署主机服务 192.168.91.5 K8S集群master01192.168.91.8 K8S集群master02192.168.91.6K8S集群node01192.168.91.7K8S集群node02192.168.91.9 负载均衡nginxkeepalive01（master）192.168.91.10 负载均衡nginxkeepalive02（backup&am…...

编程日记 2024/5/25 18:33:56

一个和蔼可亲的Python库，用Gooey为你的程序添加GUI

大家好，你有没有遇到过这样的情况：你写了一个非常棒的命令行程序，但当你分享给朋友或同事时，他们却因为害怕命令行而不愿意使用？这时候，一个简洁美观的图形用户界面（GUI）就派上用场了…...

编程日记 2024/5/25 18:32:55

第一题： 答案： class Animal{//成员变量protected String name;protected int weight;//构造方法public Animal(){this.name"refer";this.weight50;}public Animal(String name,int weight){this.namename;this.weightweight;}//成员方法publ…...

编程日记 2024/5/25 18:31:54

探索Python技巧：零基础学习缩进与逻辑关系

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆，收藏下次不迷路┗|｀O′|┛ 嗷~~ 目录一、理解Python的缩进语法缩进规则详解二、缩进在逻辑关系中的应用逻辑块示例三、实…...

编程日记 2024/5/25 18:30:53

【设计模式】JAVA Design Patterns——Callback（回调模式）

🔍目的回调是一部分被当为参数来传递给其他代码的可执行代码，接收方的代码可以在一些方便的时候来调用它。 🔍解释真实世界例子我们需要被通知当执行的任务结束时。我们为调用者传递一个回调方法然后等它调用通知我们。通俗描述回调是一…...

编程日记 2024/5/25 18:29:52

Pandas高效数据清洗与转换技巧指南【数据预处理】

三、数据处理 1.合并数据（join、merge、concat函数，append函数） Concat()函数使用 1.concat操作可以将两个pandas表在垂直方向上进行粘合或者堆叠。 join属性为outer，或默认时，返回列名并集，如&#xff…...

编程日记 2024/5/25 18:28:51

kafka防止消息丢失配置

无消息丢失最佳实践配置： 不要使用 producer.send(msg)，而要使用 producer.send(msg, callback) API。设置 acks all。是 Producer 参数。设置成 all，表明所有副本 Broker 都要接收到消息，g该消息才算是“已提交”。设置 retrie…...

编程日记 2024/5/25 18:26:49

Socket CAN中ctrlmode有哪些？

在Linux中，socketcan 的 ctrlmode 是一个用于配置CAN设备控制模式的标志字段。该字段的值由一组标志位组成，这些标志位控制CAN设备的各种操作模式。以下是一些常见的 ctrlmode 标志及其含义： CAN_CTRLMODE_LOOPBACK：描述：启用回环模式。作用：设备在发送帧的同时会接收它…...

编程日记 2024/5/25 18:25:47

find 几招在 Linux 中高效地查找目录

1. 介绍在 Linux 操作系统中，查找目录是一项常见的任务。无论是系统管理员还是普通用户，都可能需要查找特定的目录以执行各种操作，如导航文件系统、备份数据、删除文件等。Linux 提供了多种命令和工具来帮助我们在文件系统中快速找到目标目…...

编程日记 2024/5/25 18:24:46

【ELK日志收集过程】

文章目录为什么要使用ELK收集日志ELK具体应用场景ELK日志收集的流程为什么要使用ELK收集日志使用 ELK（Elasticsearch, Logstash, Kibana）进行日志收集和分析有多种原因。ELK 堆栈提供了强大、灵活且可扩展的工具集，能够满足现代 IT 系统对…...

编程日记 2024/5/25 18:23:45

设计模式—23种设计模式重点表格梳理

设计模式的核心在于提供了相关的问题的解决方案，使得人们可以更加简单方便的复用成功的设计和体系结构。按照设计模式的目的可以分为三大类。创建型模式与对象的创建有关；结构型模式处理类或对象的组合；行为型模式对类或对象怎样交互和怎样…...

编程日记 2024/5/25 18:22:44

Vue学习穿梭框Transfer组件

Vue学习Transfer组件一、前言1、案例一2、案例二一、前言在 Vue 3 中使用 el-transfer 组件可以帮助你实现数据的穿梭功能，让用户可以将数据从一个列表转移到另一个列表。下面是一个简单示例，演示如何在 Vue 3 中使用 el-transfer 组件： …...

编程日记 2024/5/25 18:21:43

Android 项目中自定义多个 RadioButton 并排一列选择效果实现

文章目录 1、静态版实现1.1、实现要求1.2、实现步骤1.3、代码实现1.4、代码实现说明1.5、结论 2、项目版实现(动态)1、先看效果图2、main的布局文件3、定义RadioButton的属性4、最后在代码中生成我想要的东东5、说明 3、后续优化方向 1、静态版实现 1.1、实现要求我们需要在…...

编程日记 2024/5/25 18:20:40

解决win系统msvcp140.dll丢失的多种常用方法，亲测有效！

msvcp140.dll 是一个重要的Windows系统文件，属于Microsoft Visual C Redistributable runtime components的一部分，特别与Visual Studio 2015及之后版本编译的C应用程序相关联。这个动态链接库（DLL）文件包含了一系列C标准库的功能…...

编程日记 2024/5/25 18:19:39

使用keepalived实现mysql主从复制的自动切换

使用Keepalived实现MySQL主从复制的自动切换通常涉及配置一个虚拟IP（VIP）作为MySQL服务器对客户端的访问点。Keepalived会监控MySQL主服务器的健康状况，如果主服务器宕机，Keepalived会自动将虚拟IP移至备用服务器，从而…...

编程日记 2024/5/25 18:17:37

智慧医疗能源事业线深度画像分析（上）

引言医疗行业作为现代社会的关键基础设施，其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入，智慧医疗能源事业线应运而生，致力于通过创新技术与管理方案，重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...

编程新知 2026/2/8 20:41:46

Docker 运行 Kafka 带 SASL 认证教程

Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明：server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...

编程新知 2026/1/23 4:15:03

Qt Widget类解析与代码注释

#include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }//解释这串代码，写上注释当然可以！这段代码是 Qt …...

编程新知 2025/11/29 21:00:30

爬虫基础学习day2

# 爬虫设计领域工商：企查查、天眼查短视频：抖音、快手、西瓜 ---> 飞瓜电商：京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空：抓取所有航空公司价格 ---> 去哪儿自媒体：采集自媒体数据进…...

编程新知 2025/12/5 3:38:11

多模态大语言模型arxiv论文略读（108）

CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题：CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者：Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...

编程新知 2026/2/1 6:11:51

MySQL JOIN 表过多的优化思路

当 MySQL 查询涉及大量表 JOIN 时，性能会显著下降。以下是优化思路和简易实现方法： 一、核心优化思路减少 JOIN 数量数据冗余：添加必要的冗余字段（如订单表直接存储用户名）合并表：将频繁关联的小表合并成…...

编程新知 2026/1/11 6:22:16

基于鸿蒙(HarmonyOS5)的打车小程序

1. 开发环境准备安装DevEco Studio (鸿蒙官方IDE)配置HarmonyOS SDK申请开发者账号和必要的API密钥 2. 项目结构设计 ├── entry │ ├── src │ │ ├── main │ │ │ ├── ets │ │ │ │ ├── pages │ │ │ │ │ ├── H…...

编程新知 2025/10/10 9:07:27