当前位置：首页 > news >正文

cudnn8编译caffe过程（保姆级图文全过程，涵盖各种报错及解决办法）

news 2025/7/7 8:10:20

众所周知，caffe是个较老的框架，而且只支持到cudnn7，但是笔者在复现ds-slam过程中又必须编译caffe，我的cuda版本是11.4，最低只支持到8.2.4，故没办法，只能编译了

在此记录过程、报错及解决办法如下;

首先安装依赖：

sudo apt-get install git
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev
libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libatlas-base-dev
sudo apt-get install python-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev

然后git项目源码：

git clone https://github.com/BVLC/caffe.git

然后编译：

cd caffe
mkdir build
cd build
cmake ..
make all
sudo make install 
make runtest

哈哈哈，不会那么顺利哒！

在cmake ..过程中，报了第一个错：

Found cuDNN: ver. ??? found (include: /usr/local/cuda-11.4/include, library: /usr/local/cuda-11.4/lib64/libcudnn.so) CMake Error at cmake/Cuda.cmake:227 (message): cuDNN version >3 is required. Call Stack (most recent call first): cmake/Cuda.cmake:255 (detect_cuDNN) cmake/Dependencies.cmake:85 (include) CMakeLists.txt:49 (include)

什么原因呢，是因为CMake 找不到或者无法正确检测到 cuDNN 的版本。错误消息中提到 “cuDNN version >3 is required”，但它没有成功识别你安装的 cuDNN 版本，但是不可能啊，我们安装了啊。

直接说解决办法;修改cmake/Cuda.cmake , 将里面的"cudnn.h" 全部用 "cudnn_version.h"代替

然后是第二个错：找不到cublas

说找不到cuda_cublas的一系列位置，这不可能，我安装了呀，先find一下：

果然有，那就set一下，在caffe的编译目录里cmake，找到相应的cuda.cmake，然后找CUDA_cublas_LIBRARY，在前添加行

set(CUDA_CUBLAS_LIBRARIES /usr/local/cuda/targets/x86_64-linux/lib/libcublas.so
)

这回这个问题过了，然后在make all过程中开始出错：

对了，这个方法还能解决

../lib/libcaffe.so.1.0.0：对‘cublasSetStream_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDdot_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDaxpy_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDscal_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasScopy_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasSgemv_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasSdot_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDcopy_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDestroy_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasSgemm_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDgemv_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDasum_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasGetStream_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasSaxpy_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasDgemm_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasSscal_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasSasum_v2’未定义的引用 ../lib/libcaffe.so.1.0.0：对‘cublasCreate_v2’未定义的引用
等一系列关于cublas*_v2的未定义的引用错误。

说是cudnn_conv_layer.cpp第131行报错

上网上一查，这是因为cudnn8里没有cudnnGetConvolutionForwardAlgorithm()这个函数了，改成了cudnnGetConvolutionForwardAlgorithm_v7()，也没了CUDNN_CONVOLUTION_FWD_SPECIFY_WORKSPACE_LIMIT这个宏定义

那么改呗：

将 src/caffe/layers/cudnn_conv_layer.cpp:中的相关位置reshape函数替换成下面的：

template <typename Dtype>
void CuDNNConvolutionLayer<Dtype>::Reshape(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top) {ConvolutionLayer<Dtype>::Reshape(bottom, top);CHECK_LE(2, this->num_spatial_axes_)<< "CuDNNConvolution input must have 2 spatial axes "<< "(e.g., height and width). "<< "Use 'engine: CAFFE' for general ND convolution.";bottom_offset_ = this->bottom_dim_ / this->group_;top_offset_ = this->top_dim_ / this->group_;const int height = bottom[0]->shape(this->channel_axis_ + 1 );const int width = bottom[0]->shape(this->channel_axis_ + 2 );const int height_out = top[0]->shape(this->channel_axis_ + 1 );const int width_out = top[0]->shape(this->channel_axis_ + 2 );const int* pad_data = this->pad_.cpu_data();const int pad_h = pad_data[0];const int pad_w = pad_data[1];const int* stride_data = this->stride_.cpu_data();const int stride_h = stride_data[0];const int stride_w = stride_data[1];#if  CUDNN_VERSION_MIN(8, 0, 0)int RetCnt;bool found_conv_algorithm;size_t free_memory, total_memory;cudnnConvolutionFwdAlgoPerf_t     fwd_algo_pref_[4];cudnnConvolutionBwdDataAlgoPerf_t bwd_data_algo_pref_[4];//get memory sizescudaMemGetInfo(&a

cudnn8编译caffe过程（保姆级图文全过程，涵盖各种报错及解决办法）

然后是第二个错：找不到cublas

说是cudnn_conv_layer.cpp第131行报错

相关文章：

cudnn8编译caffe过程（保姆级图文全过程，涵盖各种报错及解决办法）

Docker安装Nginx

大数据治理：构建新时代数据生态的关键

Leetcode 1223 LCA of Deepest TreeNode

C++从入门到起飞之——红黑树全方位剖析！

Java基于SSM微信小程序物流仓库管理系统设计与实现(lw+数据库+讲解等)

[LeetCode] 733. 图像渲染

智能EDA小白从0开始 —— DAY23 PyAether深度解析与技术展望

从深海探测到海洋强国：数字孪生助力海洋装备跨越式发展

架构师备考-背诵精华（系统质量属性）

Pycharm下载安装教程（详细步骤）+汉化设置教程

网络安全入门

你真的了解Canvas吗--解密十【ZRender篇】

mac安装brew时踩坑解决方案

基于Handsontable.js + Excel.js实现表格预览和导出功能(公式渲染)

重学SpringBoot3-集成Redis（十三）之点排行榜实现

Java 中方法参数传递的陷阱

哪家云电脑便宜又好用？ToDesk云电脑、顺网云、达龙云全方位评测

【汇编语言】寄存器（内存访问）（三）—— 字的传送

6 机器学习之应用现状

Python：操作 Excel 折叠

MMaDA: Multimodal Large Diffusion Language Models

土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测；从基础到高级，涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等

selenium学习实战【Python爬虫】

学习STC51单片机32（芯片为STC89C52RCRC）OLED显示屏2

以光量子为例，详解量子获取方式

网站指纹识别

Mysql中select查询语句的执行过程

JavaScript基础-API 和 Web API

scikit-learn机器学习