当前位置: 首页 > article >正文

【PaddlePaddle】手把手教学:在Ubuntu22.04上配置CUDA12.2环境并源码编译PaddlePaddle

1. 环境准备Ubuntu 22.04基础配置在开始PaddlePaddle的源码编译之前我们需要先搭建好基础环境。Ubuntu 22.04 LTS作为长期支持版本提供了稳定的系统基础。我建议使用物理机直接安装Ubuntu系统这样能避免WSL可能带来的兼容性问题。如果你确实需要使用WSL可以参考微软官方文档进行配置但要注意选择WSL2以获得更好的性能。首先更新系统软件源是个好习惯。我习惯使用清华源速度稳定且更新及时。执行以下命令备份原有源配置sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak然后用vim或nano编辑sources.list文件替换为以下内容deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse deb http://security.ubuntu.com/ubuntu/ jammy-security main restricted universe multiverse更新软件包列表并升级现有软件sudo apt update sudo apt upgrade -y这个步骤可能需要10-20分钟取决于你的网络速度。完成后建议重启系统确保所有更新生效。我在实际配置中发现跳过这步有时会导致后续安装的依赖版本不匹配。2. 安装必备编译工具链PaddlePaddle的编译需要完整的工具链支持。根据官方文档要求我们需要准备以下组件GCC 8.2推荐11.4G 对应GCC版本CMake 3.27实测3.16会导致CUDA标准设置错误安装GCC和Gsudo apt install gcc-11 g-11 -y设置默认版本如果系统中有多个版本sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 100 sudo update-alternatives --install /usr/bin/g g /usr/bin/g-11 100验证安装gcc --version g --version对于CMakeUbuntu 22.04默认仓库中的版本较旧我们需要手动安装3.27版本wget https://cmake.org/files/v3.27/cmake-3.27.0-linux-x86_64.tar.gz tar -zxvf cmake-3.27.0-linux-x86_64.tar.gz sudo mv cmake-3.27.0-linux-x86_64 /opt/cmake-3.27.0 sudo ln -s /opt/cmake-3.27.0/bin/cmake /usr/local/bin/cmake检查CMake版本cmake --version我遇到过CMake路径问题导致编译失败的情况建议通过which cmake确认路径是否正确。如果出现问题可以尝试在.bashrc中添加PATH变量export PATH/opt/cmake-3.27.0/bin:$PATH3. CUDA 12.2与cuDNN安装配置PaddlePaddle的GPU版本需要CUDA和cuDNN支持。这里选择CUDA 12.2作为演示版本因为它提供了良好的兼容性和性能。首先安装CUDA Toolkitwget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run sudo sh cuda_12.2.2_535.104.05_linux.run安装时注意取消勾选NVIDIA驱动如果已安装最新驱动确保CUDA Toolkit被选中安装完成后会提示添加环境变量配置CUDA环境变量echo export PATH/usr/local/cuda-12.2/bin:$PATH ~/.bashrc echo export LD_LIBRARY_PATH/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH ~/.bashrc source ~/.bashrc验证CUDA安装nvcc --version接下来安装cuDNN。需要先到NVIDIA官网下载对应版本这里使用8.9.4.25tar -xvf cudnn-linux-x86_64-8.9.4.25_cuda12-archive.tar.xz sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include/ sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64/ sudo chmod ar /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*最后安装NCCL库sudo apt install -y libnccl22.18.3-1cuda12.2 libnccl-dev2.18.3-1cuda12.2我在实际安装过程中遇到过符号链接问题可以通过重建链接解决sudo ldconfig4. Python环境与依赖项配置虽然Ubuntu自带Python3但我推荐使用Anaconda管理Python环境这样可以避免系统Python被污染。下载并安装Anacondawget https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh bash Anaconda3-2023.09-0-Linux-x86_64.sh按照提示完成安装后创建专用环境conda create -n paddle python3.11 -y conda activate paddle安装必要的Python包pip install numpy protobuf wheel配置Python环境变量这是编译PaddlePaddle的关键步骤export PYTHON_INCLUDE_DIRS$(python -c from distutils.sysconfig import get_python_inc; print(get_python_inc())) export PYTHON_LIBRARY$(python -c import distutils.sysconfig as sysconfig; print(sysconfig.get_config_var(LIBDIR)))/libpython3.11.so export PATH$(dirname $(which python)):$PATH建议将这些变量添加到.bashrc中避免每次都需要重新设置。我曾在环境变量配置上浪费过不少时间特别是PYTHON_LIBRARY路径不正确会导致编译失败。5. 获取PaddlePaddle源码并编译现在我们可以开始获取PaddlePaddle源码并进行编译了。首先克隆仓库git clone https://github.com/PaddlePaddle/Paddle.git cd Paddle git checkout develop初始化子模块这步可能需要较长时间git submodule update --init --recursive创建构建目录并配置编译选项mkdir build cd build cmake .. -DPYTHON_EXECUTABLE$(which python) \ -DPYTHON_INCLUDE_DIR$PYTHON_INCLUDE_DIRS \ -DPYTHON_LIBRARY$PYTHON_LIBRARY \ -DWITH_GPUON \ -DWITH_TESTINGOFF \ -DCMAKE_BUILD_TYPERelease这里有几个关键点需要注意确保PYTHON相关路径正确指向conda环境中的路径WITH_GPUON表示启用GPU支持WITH_TESTINGOFF可以跳过测试以加快编译速度开始编译使用所有CPU核心make -j$(nproc)编译过程可能需要1-3小时取决于你的硬件配置。我建议在性能较好的机器上执行此操作16GB内存是基本要求32GB会更顺畅。如果遇到内存不足的问题可以减少并行编译任务数make -j4 # 使用4个核心编译完成后生成的whl包位于build/python/dist目录下pip install build/python/dist/paddlepaddle_gpu-0.0.0-cp311-cp311-linux_x86_64.whl验证安装import paddle paddle.utils.run_check()如果看到PaddlePaddle is installed successfully!的提示恭喜你完成了整个编译过程6. 常见问题与解决方案在实际编译过程中可能会遇到各种问题。这里分享几个我遇到过的典型问题及解决方法问题1git子模块更新失败解决方案手动修改.gitmodules文件将https协议改为git协议[submodule third_party/protobuf] path third_party/protobuf url gitgithub.com:protocolbuffers/protobuf.git然后执行git submodule sync git submodule update --init --recursive问题2编译时内存不足解决方法增加swap空间sudo fallocate -l 8G /swapfile sudo chmod 600 /swapfile sudo mkswap /swapfile sudo swapon /swapfile减少并行编译任务数make -j2问题3CUDA相关错误解决方法确认CUDA和cuDNN版本匹配检查环境变量是否正确设置确保GPU驱动版本支持CUDA 12.2问题4Python包导入错误解决方法确认安装的whl包与Python版本匹配检查conda环境是否激活尝试重新安装依赖项pip install -r requirements.txt在整个编译过程中保持耐心很重要。遇到问题时建议先查看错误日志通常会有明确的提示。PaddlePaddle的GitHub Issues区也是很好的问题解决资源。

相关文章:

【PaddlePaddle】手把手教学:在Ubuntu22.04上配置CUDA12.2环境并源码编译PaddlePaddle

1. 环境准备:Ubuntu 22.04基础配置 在开始PaddlePaddle的源码编译之前,我们需要先搭建好基础环境。Ubuntu 22.04 LTS作为长期支持版本,提供了稳定的系统基础。我建议使用物理机直接安装Ubuntu系统,这样能避免WSL可能带来的兼容性问…...

从TMM拒稿到TOMM录用:一篇多媒体顶会论文的“重生”实战复盘(附完整时间线)

从拒稿到录用:一篇多媒体顶会论文的蜕变全记录 第一次收到TMM的拒稿邮件时,实验室的空调正发出轻微的嗡嗡声。屏幕上的文字在眼前跳动:"After careful consideration...",我盯着这行字足足看了五分钟。桌上那杯已经凉透…...

你的车载导航为啥有时不准?聊聊GNSS里‘伪距’和‘载波相位’那点事

你的车载导航为啥有时不准?揭秘GNSS定位背后的"尺子"玄机 开车时最恼火的瞬间之一,莫过于导航突然把你"扔"到隔壁田里。明明沿着高速行驶,地图上的小箭头却像喝醉酒似的左右摇摆。这背后隐藏着全球导航卫星系统&#xff…...

CAT1|MQTT接入OneNET平台实战:C语言实现Token生成与验证

1. OneNET平台MQTT接入概述 第一次接触OneNET平台的开发者可能会被它的接入流程搞得一头大。作为国内主流的物联网平台,OneNET提供了完善的设备接入能力,其中MQTT协议因其轻量级特性成为最常用的接入方式。但实际对接时,很多开发者都会卡在To…...

GD32F407串口DMA+IDLE中断接收实战:从零搭建一个稳定可靠的环形缓冲区框架

GD32F407串口DMAIDLE中断接收实战:构建工业级环形缓冲区框架 在工业控制和物联网终端设备开发中,串口通信的稳定性和可靠性直接决定了产品的质量。传统的中断接收方式在面对高频率、不定长数据包时往往力不从心,而DMAIDLE中断配合环形缓冲区的…...

mmdetection自定义数据集训练全流程解析

1. 从零开始搭建mmdetection训练环境 第一次接触mmdetection时,我被它强大的目标检测能力所吸引,但也被复杂的配置过程劝退过几次。经过多个项目的实战,我总结出了一套最稳定的环境搭建方法,特别适合新手快速上手。 mmdetection作…...

Qwen3.5-9B应用场景:技术文档问答、截图分析、多轮编程辅导落地实践

Qwen3.5-9B应用场景:技术文档问答、截图分析、多轮编程辅导落地实践 1. 认识Qwen3.5-9B大模型 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型,在技术文档处理、图像理解和编程辅助方面表现出色。这个模型特别适合需要同时处理文字和图片信息的场景&am…...

LFE并发编程:如何利用Erlang OTP构建高可用系统

LFE并发编程:如何利用Erlang OTP构建高可用系统 【免费下载链接】lfe Lisp Flavoured Erlang (LFE) 项目地址: https://gitcode.com/gh_mirrors/lf/lfe Lisp Flavoured Erlang (LFE) 是结合了Lisp语法和Erlang强大并发能力的编程语言,它允许开发者…...

前端工程化新方法:别再手动配置了

前端工程化新方法:别再手动配置了 什么是前端工程化新方法? 前端工程化新方法是指在前端开发中,随着技术的发展,出现的新的工程化技术和方法。别以为工程化只是配置 Webpack,那是十年前的玩法了。 为什么需要关注前端工…...

Qwen3.5-9B多模态能力展示:同一张产品图→识别品牌/描述功能/生成营销文案

Qwen3.5-9B多模态能力展示:同一张产品图→识别品牌/描述功能/生成营销文案 1. 多模态AI的惊艳表现 想象一下,当你上传一张产品图片,AI不仅能准确识别品牌和型号,还能详细描述产品功能,甚至为你生成吸引人的营销文案—…...

深度学习——交叉熵损失函数

调用示例 loss_fun F.cross_entropy()loss loss_fun(y_pred, labels)一句话描述 交叉熵损失函数是描述:预测的概率分布和真实概率分布之间差异的损失函数。差异越大,损失值越高;差异越小,损失值越低。 举例说明 假设有一只猫的图…...

解锁RK平台OpenCV+GStreamer全链路硬件加速:从解码到色彩转换的性能跃迁

1. 为什么你的RK平台视频处理帧率上不去? 第一次在RK3588上跑OpenCV视频处理时,我也被诡异的帧率数据惊到了——明明用了GStreamer硬解码,1080p视频居然只能跑到7帧!这就像买了辆跑车却只能龟速前进。经过反复测试发现&#xff0c…...

XUpdate自定义主题实战:打造独特版本更新提示界面

XUpdate自定义主题实战:打造独特版本更新提示界面 【免费下载链接】XUpdate 🚀A lightweight, high availability Android version update framework.(一个轻量级、高可用性的Android版本更新框架) 项目地址: https://gitcode.com/gh_mirrors/xu/XUpda…...

3DSident:你的任天堂3DS系统信息检测终极指南 [特殊字符]

3DSident:你的任天堂3DS系统信息检测终极指南 🎮 【免费下载链接】3DSident PSPident clone for 3DS 项目地址: https://gitcode.com/gh_mirrors/3d/3DSident 对于任天堂3DS的自制软件爱好者和技术用户来说,了解设备详细信息至关重要。…...

python mixer

## 聊聊 Python 里的 Mixer:一个不太起眼但很省事的工具 平时写代码,尤其是做测试或者快速搭建原型的时候,经常需要一堆假数据。比如用户的名字、邮箱、文章的标题和内容,或者订单的金额。自己手动编这些数据,写个循环…...

TCP 长连接服务:登录注册认证体系实战指南

TCP 长连接服务:登录注册认证体系实战指南 在 IM 即时通讯、游戏服务、物联网设备通信等 TCP 长连接场景中,连接准入认证是服务安全的第一道防线。 我们需要实现一套「先认证、后业务」的流程:客户端 TCP 连接建立后,不直接开放业…...

【TCP/IP】IIS FTP服务器端口冲突与匿名登录配置实战

1. IIS FTP服务器端口冲突问题解析 最近在搭建FTP服务器做TCP/IP协议分析实验时,遇到了一个典型问题:IIS FTP服务无法正常启动,匿名登录总是失败。经过排查发现,原来是FileZilla Server偷偷占用了21端口。这种情况在实际工作中很常…...

Simulink与Matlab协同建模仿真

Simulink 是 MATLAB 环境中的一个核心工具箱,构成了一个紧密集成的、以图形化建模和仿真为核心的动态系统分析平台。它们的关系与分工可以概括为:MATLAB 提供底层的计算引擎、编程语言和算法库,而 Simulink 则在此之上提供了一个直观的、基于…...

MQTT over WebSocket实战指南:从EMQX安装到消息收发全流程

1. MQTT over WebSocket 技术解析 MQTT over WebSocket 是物联网领域常用的通信方案,它巧妙地将MQTT协议的轻量级特性与WebSocket的浏览器友好性相结合。这种组合方式特别适合需要浏览器与物联网设备双向通信的场景,比如智能家居控制面板、工业监控大屏等…...

青少年软编等考五级题解目录

这个专栏发布中国电子学会主办的青少年软件编程等级考试 C 语言五级题目解析,每篇文章包含一次考试完整题目的思路解析。由于考级允许使用 C/C 语言,因此解析中给出的参考代码均为 C 代码。为了方便大家查找,特此发布一篇文章作为目录。 所有…...

Ubuntu20.04编译Carla0.9.13实战:从环境配置到资源下载的完整避坑指南

1. 环境准备:Ubuntu20.04基础配置 在开始编译Carla0.9.13之前,确保你的Ubuntu20.04系统已经完成基础环境配置。我实测发现,跳过这一步会导致后续编译过程中出现各种依赖缺失问题。首先打开终端,执行系统更新: sudo a…...

青少年软编等考四级题解目录

这个专栏发布中国电子学会主办的青少年软件编程等级考试 C 语言四级题目解析,每篇文章包含一次考试完整题目的思路解析。由于考级允许使用 C/C 语言,因此解析中给出的参考代码均为 C 代码。为了方便大家查找,特此发布一篇文章作为目录。 所有…...

从‘遍地都是’到‘最新版本’:聊聊H5st参数演变与前端风控对抗的那些事儿

H5st参数演进史:一场前端风控与自动化脚本的永恒博弈 当你在电商平台浏览商品时,页面背后正上演着一场看不见的攻防战。H5st参数作为这场战役中的关键武器,已经从最初的简单防御演变为如今复杂的加密体系。这串看似随机的字符,实际…...

小红书博主必看:AI智能体如何5分钟搞定高颜值封面+3张内容页(附保姆级教程)

小红书博主效率革命:AI智能体5分钟打造高颜值图文全攻略 每次打开小红书后台准备更新内容时,你是不是也经历过这样的纠结:花半小时找模板、一小时调排版,最后出来的效果还是不够"小红书"?作为深耕小红书运营…...

EVA-01部署教程:Qwen2.5-VL-7B模型微调+领域适配(NERV战术语料)

EVA-01部署教程:Qwen2.5-VL-7B模型微调领域适配(NERV战术语料) 1. 引言:欢迎来到NERV指挥中心 想象一下,你面前有一个能看懂图片、理解复杂场景、还能用“战术术语”和你对话的AI助手。它不仅能告诉你图片里有什么&a…...

CLIP ViT-H-14图像编码服务广告应用:创意海报图像情感倾向分析

CLIP ViT-H-14图像编码服务广告应用:创意海报图像情感倾向分析 1. 项目概述 CLIP ViT-H-14图像编码服务是基于CLIP ViT-H-14(laion2B-s32B-b79K)模型的图像特征提取解决方案,为开发者提供RESTful API和Web界面两种使用方式。这项服务特别适合需要分析图…...

达摩院春联模型实战教程:接入钉钉机器人实现群内春联点播

达摩院春联模型实战教程:接入钉钉机器人实现群内春联点播 过年贴春联,是咱们中国人的传统习俗。但每年想一副有新意、有文采的春联可不容易。现在好了,有了AI技术,这事儿变得简单又有趣。 今天要给大家分享的,就是如…...

Qwen3-ForcedAligner-0.6B多场景落地:无障碍服务为听障人士生成精准字幕流

Qwen3-ForcedAligner-0.6B多场景落地:无障碍服务为听障人士生成精准字幕流 1. 引言:让音频内容"看得见"的技术突破 想象一下这样的场景:一位听障朋友正在观看视频课程,虽然视频有字幕,但字幕与语音不同步&…...

从翻译到定制:手把手教你用Buildroot 2025.05手册玩转嵌入式Linux BSP开发

从翻译到实战:深度解析Buildroot 2025.05手册的嵌入式Linux开发实践 1. 嵌入式Linux开发的新范式 在嵌入式系统开发领域,Buildroot已成为构建轻量级Linux系统的首选工具之一。2025.05版本的Buildroot手册不仅是一份技术文档,更是嵌入式开发者…...

Linux系统下USB蓝牙SPP服务端开发实战:从环境配置到数据通信

1. 环境准备:从零搭建蓝牙开发环境 第一次在Linux下折腾蓝牙开发时,我对着满屏的命令行参数发懵。后来才发现,其实只要搞定三个核心组件就能开工:BlueZ蓝牙协议栈、USB蓝牙适配器驱动、基础开发工具链。这里分享下我验证过的配置方…...