当前位置：首页 > news >正文

Paddle Inference部署推理（十八）

news 2026/2/9 16:09:38

十八：Paddle Inference推理（C++）API详解

3. 使用 CPU 进行预测

注意：

在 CPU 型号允许的情况下，进行预测库下载或编译试尽量使用带 AVX 和 MKL 的版本
可以尝试使用 Intel 的 MKLDNN 进行 CPU 预测加速，默认 CPU 不启用 MKLDNN
在 CPU 可用核心数足够时，可以通过设置 SetCpuMathLibraryNumThreads 将线程数调高一些，默认线程数为 1

3.1. CPU 设置

// 设置 CPU 加速库计算线程数
// 参数：cpu_math_library_num_threads - CPU 加速库计算线程数
// 返回：None
void SetCpuMathLibraryNumThreads(int cpu_math_library_num_threads);// 获取 CPU 加速库计算线程数
// 参数：None
// 返回：int - CPU 加速库计算线程数
int cpu_math_library_num_threads() const;

代码示例：

// 创建默认 Config 对象
paddle_infer::Config config();// 设置 CPU 加速库线程数为 10
config.SetCpuMathLibraryNumThreads(10);// 通过 API 获取 CPU 信息
int num_thread = config.cpu_math_library_num_threads();
std::cout << "CPU thread number is: " << num_thread << std::endl; // 10

3.2. MKLDNN 设置

注意：

启用 MKLDNN 的前提为已经使用 CPU 进行预测，否则启用 MKLDNN 无法生效
启用 MKLDNN BF16 要求 CPU 型号可以支持 AVX512，否则无法启用 MKLDNN BF16
SetMkldnnCacheCapacity 请参考 MKLDNN cache设计文档
API定义如下：

// 启用 MKLDNN 进行预测加速
// 参数：None
// 返回：None
void EnableMKLDNN();// 判断是否启用 MKLDNN 
// 参数：None
// 返回：bool - 是否启用 MKLDNN
bool mkldnn_enabled() const;// 设置 MKLDNN 针对不同输入 shape 的 cache 容量大小
// 参数：int - cache 容量大小
// 返回：None
void SetMkldnnCacheCapacity(int capacity);// 指定使用 MKLDNN 加速的 OP 列表
// 参数：std::unordered_set<std::string> - 使用 MKLDNN 加速的 OP 列表
// 返回：None
void SetMKLDNNOp(std::unordered_set<std::string> op_list);// 启用 MKLDNN BFLOAT16
// 参数：None
// 返回：None
void EnableMkldnnBfloat16();// 启用 MKLDNN INT8
// 参数：op_list - 使用 MKLDNN INT8 加速的 OP 列表
// 返回：None
void EnableMkldnnInt8(const std::unordered_set<std::string>& op_list);// 判断是否启用 MKLDNN INT8
// 参数：None
// 返回：bool - 是否启用 MKLDNN INT8
bool mkldnn_int8_enabled() const;// 判断是否启用 MKLDNN BFLOAT16
// 参数：None
// 返回：bool - 是否启用 MKLDNN BFLOAT16
bool mkldnn_bfloat16_enabled() const;// 指定使用 MKLDNN BFLOAT16 加速的 OP 列表
// 参数：std::unordered_set<std::string> - 使用 MKLDNN BFLOAT16 加速的 OP 列表
// 返回：None
void SetBfloat16Op(std::unordered_set<std::string> op_list);

代码示例 (1)：使用 MKLDNN 进行预测

// 创建 Config 对象
paddle_infer::Config config(FLAGS_infer_model + "/mobilenet.pdmodel",FLAGS_infer_model + "/mobilenet.pdiparams");// 启用 MKLDNN 进行预测
config.EnableMKLDNN();
// 通过 API 获取 MKLDNN 启用结果 - true
std::cout << "Enable MKLDNN is: " << config.mkldnn_enabled() << std::endl;// 设置 MKLDNN 的 cache 容量大小
config.SetMkldnnCacheCapacity(1);// 设置启用 MKLDNN 进行加速的 OP 列表
std::unordered_set<std::string> op_list = {"softmax", "elementwise_add", "relu"};
config.SetMKLDNNOp(op_list);

代码示例 (2)：使用 MKLDNN BFLOAT16 进行预测

// 创建 Config 对象
paddle_infer::Config config(FLAGS_infer_model + "/mobilenet.pdmodel",FLAGS_infer_model + "/mobilenet.pdiparams");// 启用 MKLDNN 进行预测
config.EnableMKLDNN();// 启用 MKLDNN BFLOAT16 进行预测
config.EnableMkldnnBfloat16();
// 设置启用 MKLDNN BFLOAT16 的 OP 列表
config.SetBfloat16Op({"conv2d"});// 通过 API 获取 MKLDNN BFLOAT16 启用结果 - true
std::cout << "Enable MKLDNN BF16 is: " << config.mkldnn_bfloat16_enabled() << std::endl;

代码示例 (3)：使用 MKLDNN INT8 进行预测

// 创建 Config 对象
paddle_infer::Config config(FLAGS_infer_model + "/mobilenet.pdmodel",FLAGS_infer_model + "/mobilenet.pdiparams");// 启用 MKLDNN 进行预测
config.EnableMKLDNN();// 启用 MKLDNN INT8 进行预测
config.EnableMkldnnInt8();// 通过 API 获取 MKLDNN INT8 启用结果 - true
std::cout << "Enable MKLDNN INT8 is: " << config.mkldnn_int8_enabled() << std::endl;

Paddle Inference部署推理（十八）

十八：Paddle Inference推理 （C）API详解 3. 使用 CPU 进行预测注意： 在 CPU 型号允许的情况下，进行预测库下载或编译试尽量使用带 AVX 和 MKL 的版本可以尝试使用 Intel 的 MKLDNN 进行 CPU 预测加速，默…...

编程日记 2024/11/29 23:03:02

Redis开发02：redis.windows-service.conf 默认配置文件解析与注解

文件位置：redis安装目录下的 redis.windows-service.conf ，存放了redis服务的相关配置，下面列举出默认配置的含义： 配置项含义bind 127.0.0.1限制 Redis 只监听本地回环地址，意味着只能从本地连接 Redis。protected-m…...

编程日记 2024/11/29 23:00:59

redis大key和热key

redis中大key、热key 什么是大key大key可能产生的原因大key可能会造成什么影响如何检测大key如何优化删除大key时可能的问题删除大key的策略热key热key可能导致的问题解决热key的方法什么是大key 大key通常是指占用内存空间过大或包含大量元素的键值对。数据量大&#xff…...

编程日记 2024/11/29 22:58:58

Dubbo 最基础的 RPC 应用(使用 ZooKeeper)

看国内的一些项目时 Dubbo 这个词经常闪现，一直也不以为然，未作搜索，当然也不知道它是做什么用的。直到最近阅读关于大型网站架构相关的书中反复提到 Dubbo 后，觉得不能再对它视而不见。Google 了一下，它是在阿里巴巴创…...

编程日记 2024/11/29 22:54:53

科技赋能：企业如何通过新技术提升竞争力的策略与实践

引言在当今瞬息万变的商业环境中，科技的迅猛发展正在重新定义行业的游戏规则。无论是小型企业还是跨国巨头，都感受到数字化转型的迫切需求。过去，企业竞争力更多依赖于成本控制、资源调配或市场覆盖，而如今，新技术的引…...

编程日记 2024/11/29 22:53:51

本章使用Pytorch的API实现RNN上的语言模型训练 0 导入库 import torch import torch.nn as nn import torch.nn.functional as F from torch.utils.data import Dataset, DataLoader from collections import Counter import re import math from tqdm import tqdm1 准备数据 …...

编程日记 2024/11/29 22:51:49

【FAQ】HarmonyOS SDK 闭源开放能力 — 公共模块

1.问题描述： 文档哪里能找到所有的权限查看该权限是用户级的还是系统级的。解决方案： 您好，可以看一下下方链接是否可以解决问题： https://developer.huawei.com/consumer/cn/doc/harmonyos-guides-V5/permissions-for-all-V…...

编程日记 2024/11/29 22:50:46

百度文心一言 vs 阿里通义千问哪个好？

背景介绍： 在当前的人工智能领域，随着大模型技术的快速发展，市场上涌现出了众多的大规模语言模型。然而，由于缺乏统一且权威的评估标准，很多关于这些模型能力的文章往往基于主观测试或自行设定的排行榜来评价模型性能…...

编程日记 2024/11/29 22:48:43

内网不出网上线cs

一:本地正向代理目标如下，本地(10.211.55.2)挂好了基于 reGeorg 的 http 正向代理。代理为: Socks5 10.211.55.2 1080python2 reGeorgSocksProxy.py -l 0.0.0.0 -p 1080 -u http://10.211.55.3:8080/shiro/tunnel.jsp 二：虚拟机配置proxifer 我们是…...

编程日记 2024/11/29 22:47:41

ubuntu22开机自动登陆和开机自动运行google浏览器自动打开网页

一、开机自动登陆 1、打开settings->点击Users 重启系统即可自动登陆桌面二、开机自动运行google浏览器自动打开网页 1、安装google浏览器 sudo wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb sudo dpkg -i ./google-chrome-stable…...

编程日记 2024/11/29 22:46:40

企业建站高性能的内容管理系统

AnQiCMS 是一款高性能的内容管理系统，基于Go语言开发。它支持多站点、多语言管理，提供灵活的内容发布和模板管理功能，同时，系统内置丰富的利于SEO操作的功能，支持包括自定义字段、文档分类、批量导入导出等功能 AnQiC…...

编程日记 2024/11/29 22:42:35

【爬虫框架：feapder，管理系统 feaplat】

github：https://github.com/Boris-code/feapder 爬虫管理系统 feaplat：http://feapder.com/#/feapder_platform/feaplat 爬虫在线工具库 ：http://www.spidertools.cn ：https://www.kgtools.cn/1、feapder 简介对于学习 Python…...

编程日记 2024/11/29 22:38:31

faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-5

训练过程通过gdb调试得到这个ivfsq的训练过程，我尝试对这个内容具体训练过程进行解析，对每个调用栈里面的逻辑和代码进行解读。步骤函数名称调用位置说明1faiss::IndexIVF::train/faiss/IndexIVF.cpp:1143开始训练，判断是否需要训练第一级…...

编程日记 2024/11/29 22:36:29

代码随想录算法训练营第六十天|Day60 图论

Bellman_ford 队列优化算法（又名SPFA） https://www.programmercarl.com/kamacoder/0094.%E5%9F%8E%E5%B8%82%E9%97%B4%E8%B4%A7%E7%89%A9%E8%BF%90%E8%BE%93I-SPFA.html 本题我们来系统讲解 Bellman_ford 队列优化算法 ，也叫SPFA算法&#xf…...

编程日记 2024/11/29 22:35:28

在嵌入式Linux下如何用QT开发UI

在嵌入式 Linux 环境下使用 Qt 开发用户界面 (UI) 是一个常见的选择。Qt 提供了丰富的功能、跨平台支持以及优秀的图形界面开发能力，非常适合用于嵌入式系统。以下是开发流程的详细步骤： 1. 准备开发环境硬件环境一块运行嵌入式 Linux 的开发板&…...

编程日记 2024/11/29 22:32:22

【JavaScript】Promise详解

Promise 是 JavaScript 中处理异步操作的一种强大机制。它提供了一种更清晰、更可控的方式来处理异步代码，避免了回调地狱（callback hell）和复杂的错误处理。基本概念状态： Pending：初始状态，既不是成功…...

编程日记 2024/11/29 22:28:15

1062 Talent and Virtue

About 900 years ago, a Chinese philosopher Sima Guang wrote a history book in which he talked about peoples talent and virtue. According to his theory, a man being outstanding in both talent and virtue must be a "sage（圣人）"…...

编程日记 2024/11/29 22:27:14

C++《二叉搜索树》

在初阶数据结构中我学习了树基础的概念以及了解了顺序结构的二叉树——堆和链式结构二叉树该如何实现，那么接下来我们将进一步的学习二叉树，在此会先后学习到二叉搜索树、AVL树、红黑树；通过这些的学习将让我们更易于理解后面set、map、哈希等…...

编程日记 2024/11/29 22:26:13

机器学习-神经网络（BP神经网络前向和反向传播推导）

1.1 神经元模型神经网络(neural networks)方面的研究很早就已出现,今天“神经网络”已是一个相当大的、多学科交叉的学科领域.各相关学科对神经网络的定义多种多样,本书采用目前使用得最广泛的一种,即“神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够…...

编程日记 2024/11/29 22:25:11

基于智能物联网关的车辆超重AI检测应用

超重超载是严重的交通违法行为，超重超载车辆的交通安全风险极高，像是一颗行走的“不定时炸弹”，威胁着社会公众的安全。但总有一些人受到利益驱使，使超重超载的违法违规行为时有发生。随着物联网和AI技术的发展，针对预…...

编程日记 2024/11/29 22:19:04

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能，包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

编程新知 2025/11/14 9:31:35

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

先前我们总结了浏览器选区模型的交互策略，并且实现了基本的选区操作，还调研了自绘选区的实现。那么相对的，我们还需要设计编辑器的选区表达，也可以称为模型选区。编辑器中应用变更时的操作范围，就是以模型选区为基准来…...

编程新知 2026/1/16 16:34:26

EtherNet/IP转DeviceNet协议网关详解

一，设备主要功能疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络，本网关连接到EtherNet/IP总线中做为从站使用，连接到DeviceNet总线中做为从站使用。在自动…...

编程新知 2026/1/31 6:53:51

大学生职业发展与就业创业指导教学评价

这里是引用作为软工2203/2204班的学生，我们非常感谢您在《大学生职业发展与就业创业指导》课程中的悉心教导。这门课程对我们即将面临实习和就业的工科学生来说至关重要，而您认真负责的教学态度，让课程的每一部分都充满了实用价值。尤其让我…...

编程新知 2025/11/16 1:39:27

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一，概述 1. 目的将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本：2014.07； Kernel版本：Linux-3.10； 二，Uboot 1. sys_config.fex改动使能uart3(TX:PH00 RX:PH01)，并让boo…...

编程新知 2026/2/5 6:28:09

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式：dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一，腐蚀跟膨胀属于反向操作，膨胀是把图像图像变大，而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。腐蚀…...

编程新知 2026/2/8 22:00:17

接口自动化测试：HttpRunner基础

相关文档 HttpRunner V3.x中文文档 HttpRunner 用户指南使用HttpRunner 3.x实现接口自动化测试 HttpRunner介绍 HttpRunner 是一个开源的 API 测试工具，支持 HTTP(S)/HTTP2/WebSocket/RPC 等网络协议，涵盖接口测试、性能测试、数字体验监测等测试类型…...

编程新知 2026/1/29 7:31:17

【Veristand】Veristand环境安装教程-Linux RT / Windows

首先声明，此教程是针对Simulink编译模型并导入Veristand中编写的，同时需要注意的是老用户编译可能用的是Veristand Model Framework，那个是历史版本，且NI不会再维护，新版本编译支持为VeriStand Model Generation Suppo…...

编程新知 2026/2/5 20:04:55

java高级——高阶函数、如何定义一个函数式接口类似stream流的filter

java高级——高阶函数、stream流前情提要文章介绍一、函数伊始1.1 合格的函数1.2 有形的函数2. 函数对象2.1 函数对象——行为参数化2.2 函数对象——延迟执行二、函数编程语法1. 函数对象表现形式1.1 Lambda表达式1.2 方法引用（Math::max） 2 函数接口…...

编程新知 2026/2/9 5:15:34

字符串哈希+KMP

P10468 兔子与兔子 #include<bits/stdc.h> using namespace std; typedef unsigned long long ull; const int N 1000010; ull a[N], pw[N]; int n; ull gethash(int l, int r){return a[r] - a[l - 1] * pw[r - l 1]; } signed main(){ios::sync_with_stdio(false), …...

编程新知 2025/12/13 5:58:57

Paddle Inference部署推理（十八）

十八：Paddle Inference推理（C++）API详解

3. 使用 CPU 进行预测

3.1. CPU 设置

3.2. MKLDNN 设置

相关文章：

Paddle Inference部署推理（十八）

Redis开发02：redis.windows-service.conf 默认配置文件解析与注解

redis大key和热key

Dubbo 最基础的 RPC 应用(使用 ZooKeeper)

科技赋能：企业如何通过新技术提升竞争力的策略与实践

从0开始深度学习（33）——循环神经网络的简洁实现

【FAQ】HarmonyOS SDK 闭源开放能力 — 公共模块

百度文心一言 vs 阿里通义千问哪个好？

内网不出网上线cs

ubuntu22开机自动登陆和开机自动运行google浏览器自动打开网页

企业建站高性能的内容管理系统

【爬虫框架：feapder，管理系统 feaplat】

faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-5

代码随想录算法训练营第六十天|Day60 图论

在嵌入式Linux下如何用QT开发UI

【JavaScript】Promise详解

1062 Talent and Virtue

C++《二叉搜索树》

机器学习-神经网络（BP神经网络前向和反向传播推导）

基于智能物联网关的车辆超重AI检测应用

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

EtherNet/IP转DeviceNet协议网关详解

大学生职业发展与就业创业指导教学评价

全志A40i android7.1 调试信息打印串口由uart0改为uart3

OPENCV形态学基础之二腐蚀

接口自动化测试：HttpRunner基础

【Veristand】Veristand环境安装教程-Linux RT / Windows

java高级——高阶函数、如何定义一个函数式接口类似stream流的filter

字符串哈希+KMP

十八：Paddle Inference推理 （C++）API详解

3. 使用 CPU 进行预测

3.1. CPU 设置

3.2. MKLDNN 设置

相关文章：

十八：Paddle Inference推理（C++）API详解