当前位置：首页 > news >正文

从零构建深度学习推理框架-3 手写算子relu

news 2025/12/15 7:57:39

Relu介绍：

$f(x) = \left\{\begin{matrix}x , x>thresh & & \\0,x<thresh & & \end{matrix}\right.$

relu是一个非线性激活函数，可以避免梯度消失，过拟合等情况。我们一般将thresh设为0。

operator类：

#ifndef KUIPER_COURSE_INCLUDE_OPS_OP_HPP_
#define KUIPER_COURSE_INCLUDE_OPS_OP_HPP_
namespace kuiper_infer {
enum class OpType {kOperatorUnknown = -1,kOperatorRelu = 0,
};class Operator {public:OpType op_type_ = OpType::kOperatorUnknown; //不是一个具体节点 制定为unknownvirtual ~Operator() = default; //explicit Operator(OpType op_type);
};

这里的 kOperatorUnknown = -1 , kOperatorRelu = 0分别是他们的代号

operator是一个父类，我们的relu就要继承于这个父类

class ReluOperator : public Operator {public:~ReluOperator() override = default;explicit ReluOperator(float thresh);void set_thresh(float thresh);float get_thresh() const;private:// 需要传递到reluLayer中，怎么传递？float thresh_ = 0.f; // 用于过滤tensor<float>值当中大于thresh的部分// relu存的变量只有thresh// stride padding kernel_size 这些是到时候convOperator需要的// operator起到了属性存储、变量的作用// operator所有子类不负责具体运算// 具体运算由另外一个类Layer类负责// y =x  , if x >=0 y = 0 if x < 0};

operator起到了属性存储、变量的作用
operator所有子类不负责具体运算
具体运算由另外一个类Layer类负责

layer类:

class Layer {public:explicit Layer(const std::string &layer_name);virtual void Forwards(const std::vector<std::shared_ptr<Tensor<float>>> &inputs,std::vector<std::shared_ptr<Tensor<float>>> &outputs);// reluLayer中 inputs 等于 x , outputs 等于 y= x，if x>0// 计算得到的结果放在y当中，x是输入，放在inputs中virtual ~Layer() = default;private:std::string layer_name_; //relu layer "relu"
};

父类只保留了一个layer_name属性和两个方法。

具体的在relu_layer这个class中

class ReluLayer : public Layer {public:~ReluLayer() override = default;// 通过这里，把relu_op中的thresh告知给relu layer, 因为计算的时候要用到explicit ReluLayer(const std::shared_ptr<Operator> &op);// 执行relu 操作的具体函数Forwardsvoid Forwards(const std::vector<std::shared_ptr<Tensor<float>>> &inputs,std::vector<std::shared_ptr<Tensor<float>>> &outputs) override;// 下节的内容，不用管static std::shared_ptr<Layer> CreateInstance(const std::shared_ptr<Operator> &op);private:std::unique_ptr<ReluOperator> op_;
};

具体的方法实现：

ReluLayer::ReluLayer(const std::shared_ptr<Operator> &op) : Layer("Relu") {CHECK(op->op_type_ == OpType::kOperatorRelu) << "Operator has a wrong type: " << int(op->op_type_);// dynamic_cast是什么意思？ 就是判断一下op指针是不是指向一个relu_op类的指针// 这边的op不是ReluOperator类型的指针，就报错// 我们这里只接受ReluOperator类型的指针// 父类指针必须指向子类ReluOperator类型的指针// 为什么不讲构造函数设置为const std::shared_ptr<ReluOperator> &op？// 为了接口统一，具体下节会说到ReluOperator *relu_op = dynamic_cast<ReluOperator *>(op.get());CHECK(relu_op != nullptr) << "Relu operator is empty";// 一个op实例和一个layer 一一对应 这里relu op对一个relu layer// 对应关系this->op_ = std::make_unique<ReluOperator>(relu_op->get_thresh());
}void ReluLayer::Forwards(const std::vector<std::shared_ptr<Tensor<float>>> &inputs,std::vector<std::shared_ptr<Tensor<float>>> &outputs) {// relu 操作在哪里，这里！// 我需要该节点信息的时候 直接这么做// 实行了属性存储和运算过程的分离！！！！！！！！！！！！！！！！！！！！！！！！//x就是inputs y = outputsCHECK(this->op_ != nullptr);CHECK(this->op_->op_type_ == OpType::kOperatorRelu);const uint32_t batch_size = inputs.size(); //一批x，放在vec当中，理解为batchsize数量的tensor，需要进行relu操作for (int i = 0; i < batch_size; ++i) {CHECK(!inputs.at(i)->empty());const std::shared_ptr<Tensor<float>> &input_data = inputs.at(i); //取出批次当中的一个张量//对张量中的每一个元素进行运算，进行relu运算input_data->data().transform([&](float value) {// 对张良中的没一个元素进行运算// 从operator中得到存储的属性float thresh = op_->get_thresh();//x >= threshif (value >= thresh) {return value; // return x} else {// x<= thresh return 0.f;return 0.f;}});// 把结果y放在outputs中outputs.push_back(input_data);}
}

从零构建深度学习推理框架-3 手写算子relu

Relu介绍： relu是一个非线性激活函数，可以避免梯度消失，过拟合等情况。我们一般将thresh设为0。 operator类： #ifndef KUIPER_COURSE_INCLUDE_OPS_OP_HPP_ #define KUIPER_COURSE_INCLUDE_OPS_OP_HPP_ namespace kuiper_infer {…...

编程日记 2023/8/2 22:44:12

想做上位机，学C#还是QT？

学习C#还是Qt，取决于你的具体需求和偏好。如果你计划开发跨平台的桌面应用程序，并且希望使用一种更轻量级、直观的界面框架，那么Qt可能是一个不错的选择。Qt是一个功能丰富且成熟的跨平台框架，支持多种开发语言（包括…...

编程日记 2023/8/2 22:43:10

Ansible —— playbook 剧本

Ansible —— playbook 剧本一、playbook的概述1.playbook简介2.什么是Ansible playbook剧本？3.Ansible playbook剧本的特点4.如何使用Ansible playbook剧本？5.playbooks 本身由以下各部分组成二、playbook示例1.运行playbook2.定义、引用变量3.指定远…...

编程日记 2023/8/2 22:42:09

ARM寻址方式

寻址方式寻址方式是根据指令中给出的地址码字段来实现寻找操作数地址的方式，ARM中有以下8种基本的寻址方式。 1、寄存器寻址将寄存器中的值作为操作数，指令中的地址码字段是寄存器编号。 MOV R1,R2 ;R1 R2 ADD R0,R1,R2 ;R0 R1 R22、立即寻…...

编程日记 2023/8/2 22:41:08

【JAVA】String ，StringBuffer 和 StringBuilder 三者有何联系？

个人主页：【😊个人主页】系列专栏：【❤️初识JAVA】文章目录前言StringBufferStringBuffer方法 StringBuilderStringBuilder方法 String ，StringBuffer 和 StringBuilder的区别String和StringBuffer互相转换前言在之前的文章…...

编程日记 2023/8/2 22:40:05

关于计数以及Index返回订单号升级版（控制字符长度，控制年月标记）

数据库表操作： EXEC sys.sp_dropextendedproperty nameNName , level0typeNSCHEMA,level0nameNdbo, level1typeNTABLE,level1nameNSetNoIndexGOEXEC sys.sp_dropextendedproperty nameNMS_Description , level0typeNSCHEMA,level0nameNdbo, level1typeNTABLE,level…...

编程日记 2023/8/2 22:39:05

【计算机网络】11、网桥（bridge)、集线器（hub）、交换机（switch）、路由器（router）、网关（gateway）

文章目录一、网桥（bridge)二、集线器（hub）三、交换机（switch)四、路由器（router）五、网关（gateway） 对于hub，一个包过来后，直接将包转发到其他口。对于桥&…...

编程日记 2023/8/2 22:38:03

第九篇-自我任务数据准备

格式化自我意识数据用于ChatGLM微调准备数据源 https://github.com/hiyouga/ChatGLM-Efficient-Tuning cd data self_cognition.json代码self_process.py #!/usr/bin/python # -*- coding: UTF-8 -*- # 读取self_cognition自我认知解析并写入转换新文件import json# 读取se…...

编程日记 2023/8/2 22:37:01

2023.8.1号论文阅读

文章目录 MCPA: Multi-scale Cross Perceptron Attention Network for 2D Medical Image Segmentation摘要本文方法实验结果 SwinMM: Masked Multi-view with SwinTransformers for 3D Medical Image Segmentation摘要本文方法实验结果 MCPA: Multi-scale Cross Perceptron Att…...

编程日记 2023/8/2 22:36:00

webpack优化前端框架性能

webpack优化目的 webpack优化目的1. 提升开发体验提升开发体验使用 SourceMap 2. 提升打包构建速度提升打包构建速度（开发模式）提升打包速度 oneOf提升打包速度 include（包含）/exclude（排除）提升第二次打包…...

编程日记 2023/8/2 22:34:56

Unity UGUI的Outline(描边)组件的介绍及使用

Unity UGUI的Outline(描边)组件的介绍及使用 1. 什么是Outline(描边)组件？ Outline(描边)组件是Unity UGUI中的一种特效组件，用于给UI元素添加描边效果。通过设置描边的颜色、宽度和模糊程度，可以使UI元素在视觉上更加突出。 2. Outline(描…...

编程日记 2023/8/2 22:33:55

爆改vue3 setup naiveui可编辑table

使用naiveui官网的可编辑table总是报错，所以手写了一个思路：table数据数组unitMsgArr对应一个布尔的数组isEditArr ，点击table可编辑的行数据的时候，更改对应的isEdit为true，此时渲染组件EditCom，在EditC…...

编程日记 2023/8/2 22:32:52

功率放大器的种类有哪三种类型

功率放大器是一种能将输入信号转换为更高功率输出的电子设备。在电子工程和音频领域中，功率放大器通常被分为三种类型：A类、B类和AB类。下面安泰电子将详细介绍这三种类型的功率放大器及其特点。 A类功率放大器 A类功率放大器是一种基本的线性功率放大器…...

编程日记 2023/8/2 22:31:50

HDFS 分布式存储 spark storm HBase

HDFS 分布式存储 spark storm HBase 分布式结构 master slave name node client 负责文件的拆分 128MB 3份 data node MapReduce 分布式计算离线计算 2.X之前速度比较慢对比spark 编程思想 Map 分 Reduce 合 hadoop streaming Mrjob Yarn 资源管理 cpu 内存 MapReduc…...

编程日记 2023/8/2 22:30:49

Vue3文字实现左右和上下滚动

可自定义设置以下属性： 滚动文字数组（sliderText），类型：Array<{title: string, link?: string}>，必传，默认[] 滚动区域宽度（width），类型&#xff1a…...

编程日记 2023/8/2 22:29:48

Docker Sybase修改中文编码

镜像：datagrip/sybase 镜像默认用户名sa，密码myPassword，服务名MYSYBASE 1.进入容器 docker exec -it <container_name> /bin/bash2.加载Sybase环境变量 source /opt/sybase/SYBASE.sh3.查看是否安装了中文字符集 isql -Usa -PmyP…...

编程日记 2023/8/2 22:28:46

【SpringCloud Alibaba】（六）使用 Sentinel 实现服务限流与容错

今天，我们就使用 Sentinel 实现接口的限流，并使用 Feign 整合 Sentinel 实现服务容错的功能，让我们体验下微服务使用了服务容错功能的效果。因为内容仅仅围绕着 SpringCloud Alibaba技术栈展开，所以，这里我们使用的服…...

编程日记 2023/8/2 22:27:46

mysql的主从复制

1.主从复制的原理主从复制的原理是通过基于日志的复制方式实现数据的同步。当主服务器上发生数据变更时，会将这些变更写入二进制日志（Binary Log）中。从服务器通过连接到主服务器，请求从主服务器获取二进制日志，并将…...

编程日记 2023/8/2 22:26:41

【Golang 接口自动化03】解析接口返回XML

目录解析接口返回数据定义结构体解析函数： 测试优化资料获取方法上一篇我们学习了怎么发送各种数据类型的http请求，这一篇我们来介绍怎么来解析接口返回的XML的数据。解析接口返回数据定义结构体假设我们现在有一个接口返回的数据resp如…...

编程日记 2023/8/2 22:25:40

Java+bcprov库实现对称和非对称加密算法

BouncyCastle，即BC，其是一款开源的密码包，包含了大量的密码算法。本篇主要演示BC库引入，对称加密算法AES、SM4和非对称加密EC算法的简单实现，以下是实现过程。一、将BC添加到JRE环境前提：已安装JRE环…...

编程日记 2023/8/2 22:24:39

【2025年】解决Burpsuite抓不到https包的问题

环境：windows11 burpsuite:2025.5 在抓取https网站时，burpsuite抓取不到https数据包，只显示： 解决该问题只需如下三个步骤： 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...

编程新知 2025/12/13 5:39:02

IT供电系统绝缘监测及故障定位解决方案

随着新能源的快速发展，光伏电站、储能系统及充电设备已广泛应用于现代能源网络。在光伏领域，IT供电系统凭借其持续供电性好、安全性高等优势成为光伏首选，但在长期运行中，例如老化、潮湿、隐裂、机械损伤等问题会影响光伏板绝缘层…...

编程新知 2025/12/15 2:28:05

vue3+vite项目中使用.env文件环境变量方法

vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量，这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...

编程新知 2025/12/13 23:42:56

代理篇12|深入理解 Vite中的Proxy接口代理配置

在前端开发中，常常会遇到跨域请求接口的情况。为了解决这个问题，Vite 和 Webpack 都提供了 proxy 代理功能，用于将本地开发请求转发到后端服务器。什么是代理（proxy）？代理是在开发过程中，前端项目通过开发服务器，将指定的请求“转发”到真实的后端服务器，从而绕…...

编程新知 2025/10/27 20:33:34

Scrapy-Redis分布式爬虫架构的可扩展性与容错性增强：基于微服务与容器化的解决方案

在大数据时代，海量数据的采集与处理成为企业和研究机构获取信息的关键环节。Scrapy-Redis作为一种经典的分布式爬虫架构，在处理大规模数据抓取任务时展现出强大的能力。然而，随着业务规模的不断扩大和数据抓取需求的日益复杂，传统…...

编程新知 2025/12/13 2:43:43

git: early EOF

macOS报错： Initialized empty Git repository in /usr/local/Homebrew/Library/Taps/homebrew/homebrew-core/.git/ remote: Enumerating objects: 2691797, done. remote: Counting objects: 100% (1760/1760), done. remote: Compressing objects: 100% (636/636…...

编程新知 2025/10/12 2:03:36

云安全与网络安全：核心区别与协同作用解析

在数字化转型的浪潮中，云安全与网络安全作为信息安全的两大支柱，常被混淆但本质不同。本文将从概念、责任分工、技术手段、威胁类型等维度深入解析两者的差异，并探讨它们的协同作用。一、核心区别定义与范围网络安全：聚焦于保…...

编程新知 2025/12/12 12:44:52

2.3 物理层设备

在这个视频中，我们要学习工作在物理层的两种网络设备，分别是中继器和集线器。首先来看中继器。在计算机网络中两个节点之间，需要通过物理传输媒体或者说物理传输介质进行连接。像同轴电缆、双绞线就是典型的传输介质，假设A节点要给…...

编程新知 2025/12/12 10:18:30

用递归算法解锁「子集」问题 —— LeetCode 78题解析

文章目录一、题目介绍二、递归思路详解：从决策树开始理解三、解法一：二叉决策树 DFS四、解法二：组合式回溯写法（推荐）五、解法对比递归算法是编程中一种非常强大且常见的思想，它能够优雅地解决很多复杂的…...

编程新知 2025/10/4 7:43:43

2025-05-08-deepseek本地化部署

title: 2025-05-08-deepseek 本地化部署 tags: 深度学习程序开发 2025-05-08-deepseek 本地化部署参考博客本地部署 DeepSeek：小白也能轻松搞定！ 如何给本地部署的 DeepSeek 投喂数据，让他更懂你 [实验目的]：理解系统架构与原…...

编程新知 2025/12/14 23:10:29

Relu介绍：

operator类：

layer类:

相关文章：