从零构建深度学习推理框架-3 手写算子relu
Relu介绍:
relu是一个非线性激活函数,可以避免梯度消失,过拟合等情况。我们一般将thresh设为0。
operator类:
#ifndef KUIPER_COURSE_INCLUDE_OPS_OP_HPP_
#define KUIPER_COURSE_INCLUDE_OPS_OP_HPP_
namespace kuiper_infer {
enum class OpType {kOperatorUnknown = -1,kOperatorRelu = 0,
};class Operator {public:OpType op_type_ = OpType::kOperatorUnknown; //不是一个具体节点 制定为unknownvirtual ~Operator() = default; //explicit Operator(OpType op_type);
};
这里的 kOperatorUnknown = -1 , kOperatorRelu = 0分别是他们的代号
operator是一个父类,我们的relu就要继承于这个父类
class ReluOperator : public Operator {public:~ReluOperator() override = default;explicit ReluOperator(float thresh);void set_thresh(float thresh);float get_thresh() const;private:// 需要传递到reluLayer中,怎么传递?float thresh_ = 0.f; // 用于过滤tensor<float>值当中大于thresh的部分// relu存的变量只有thresh// stride padding kernel_size 这些是到时候convOperator需要的// operator起到了属性存储、变量的作用// operator所有子类不负责具体运算// 具体运算由另外一个类Layer类负责// y =x , if x >=0 y = 0 if x < 0};
operator起到了属性存储、变量的作用
operator所有子类不负责具体运算
具体运算由另外一个类Layer类负责
layer类:
class Layer {public:explicit Layer(const std::string &layer_name);virtual void Forwards(const std::vector<std::shared_ptr<Tensor<float>>> &inputs,std::vector<std::shared_ptr<Tensor<float>>> &outputs);// reluLayer中 inputs 等于 x , outputs 等于 y= x,if x>0// 计算得到的结果放在y当中,x是输入,放在inputs中virtual ~Layer() = default;private:std::string layer_name_; //relu layer "relu"
};
父类只保留了一个layer_name属性和两个方法。
具体的在relu_layer这个class中
class ReluLayer : public Layer {public:~ReluLayer() override = default;// 通过这里,把relu_op中的thresh告知给relu layer, 因为计算的时候要用到explicit ReluLayer(const std::shared_ptr<Operator> &op);// 执行relu 操作的具体函数Forwardsvoid Forwards(const std::vector<std::shared_ptr<Tensor<float>>> &inputs,std::vector<std::shared_ptr<Tensor<float>>> &outputs) override;// 下节的内容,不用管static std::shared_ptr<Layer> CreateInstance(const std::shared_ptr<Operator> &op);private:std::unique_ptr<ReluOperator> op_;
};
具体的方法实现:
ReluLayer::ReluLayer(const std::shared_ptr<Operator> &op) : Layer("Relu") {CHECK(op->op_type_ == OpType::kOperatorRelu) << "Operator has a wrong type: " << int(op->op_type_);// dynamic_cast是什么意思? 就是判断一下op指针是不是指向一个relu_op类的指针// 这边的op不是ReluOperator类型的指针,就报错// 我们这里只接受ReluOperator类型的指针// 父类指针必须指向子类ReluOperator类型的指针// 为什么不讲构造函数设置为const std::shared_ptr<ReluOperator> &op?// 为了接口统一,具体下节会说到ReluOperator *relu_op = dynamic_cast<ReluOperator *>(op.get());CHECK(relu_op != nullptr) << "Relu operator is empty";// 一个op实例和一个layer 一一对应 这里relu op对一个relu layer// 对应关系this->op_ = std::make_unique<ReluOperator>(relu_op->get_thresh());
}void ReluLayer::Forwards(const std::vector<std::shared_ptr<Tensor<float>>> &inputs,std::vector<std::shared_ptr<Tensor<float>>> &outputs) {// relu 操作在哪里,这里!// 我需要该节点信息的时候 直接这么做// 实行了属性存储和运算过程的分离!!!!!!!!!!!!!!!!!!!!!!!!//x就是inputs y = outputsCHECK(this->op_ != nullptr);CHECK(this->op_->op_type_ == OpType::kOperatorRelu);const uint32_t batch_size = inputs.size(); //一批x,放在vec当中,理解为batchsize数量的tensor,需要进行relu操作for (int i = 0; i < batch_size; ++i) {CHECK(!inputs.at(i)->empty());const std::shared_ptr<Tensor<float>> &input_data = inputs.at(i); //取出批次当中的一个张量//对张量中的每一个元素进行运算,进行relu运算input_data->data().transform([&](float value) {// 对张良中的没一个元素进行运算// 从operator中得到存储的属性float thresh = op_->get_thresh();//x >= threshif (value >= thresh) {return value; // return x} else {// x<= thresh return 0.f;return 0.f;}});// 把结果y放在outputs中outputs.push_back(input_data);}
}
相关文章:
从零构建深度学习推理框架-3 手写算子relu
Relu介绍: relu是一个非线性激活函数,可以避免梯度消失,过拟合等情况。我们一般将thresh设为0。 operator类: #ifndef KUIPER_COURSE_INCLUDE_OPS_OP_HPP_ #define KUIPER_COURSE_INCLUDE_OPS_OP_HPP_ namespace kuiper_infer {…...
想做上位机,学C#还是QT?
学习C#还是Qt,取决于你的具体需求和偏好。 如果你计划开发跨平台的桌面应用程序,并且希望使用一种更轻量级、直观的界面框架,那么Qt可能是一个不错的选择。Qt是一个功能丰富且成熟的跨平台框架,支持多种开发语言(包括…...
Ansible —— playbook 剧本
Ansible —— playbook 剧本 一、playbook的概述1.playbook简介2.什么是Ansible playbook剧本?3.Ansible playbook剧本的特点4.如何使用Ansible playbook剧本?5.playbooks 本身由以下各部分组成 二、playbook示例1.运行playbook2.定义、引用变量3.指定远…...
ARM寻址方式
寻址方式 寻址方式是根据指令中给出的地址码字段来实现寻找操作数地址的方式,ARM中有以下8种基本的寻址方式。 1、寄存器寻址 将寄存器中的值作为操作数,指令中的地址码字段是寄存器编号。 MOV R1,R2 ;R1 R2 ADD R0,R1,R2 ;R0 R1 R22、立即寻…...
【JAVA】String ,StringBuffer 和 StringBuilder 三者有何联系?
个人主页:【😊个人主页】 系列专栏:【❤️初识JAVA】 文章目录 前言StringBufferStringBuffer方法 StringBuilderStringBuilder方法 String ,StringBuffer 和 StringBuilder的区别String和StringBuffer互相转换 前言 在之前的文章…...
关于计数以及Index返回订单号升级版(控制字符长度,控制年月标记)
数据库表操作: EXEC sys.sp_dropextendedproperty nameNName , level0typeNSCHEMA,level0nameNdbo, level1typeNTABLE,level1nameNSetNoIndexGOEXEC sys.sp_dropextendedproperty nameNMS_Description , level0typeNSCHEMA,level0nameNdbo, level1typeNTABLE,level…...
【计算机网络】11、网桥(bridge)、集线器(hub)、交换机(switch)、路由器(router)、网关(gateway)
文章目录 一、网桥(bridge)二、集线器(hub)三、交换机(switch)四、路由器(router)五、网关(gateway) 对于hub,一个包过来后,直接将包转发到其他口。 对于桥&…...
第九篇-自我任务数据准备
格式化自我意识数据用于ChatGLM微调 准备数据源 https://github.com/hiyouga/ChatGLM-Efficient-Tuning cd data self_cognition.json代码self_process.py #!/usr/bin/python # -*- coding: UTF-8 -*- # 读取self_cognition自我认知解析并写入转换新文件import json# 读取se…...
2023.8.1号论文阅读
文章目录 MCPA: Multi-scale Cross Perceptron Attention Network for 2D Medical Image Segmentation摘要本文方法实验结果 SwinMM: Masked Multi-view with SwinTransformers for 3D Medical Image Segmentation摘要本文方法实验结果 MCPA: Multi-scale Cross Perceptron Att…...
webpack优化前端框架性能
webpack优化目的 webpack优化目的1. 提升开发体验提升开发体验使用 SourceMap 2. 提升打包构建速度提升打包构建速度(开发模式)提升打包速度 oneOf提升打包速度 include(包含)/exclude(排除)提升第二次打包…...
Unity UGUI的Outline(描边)组件的介绍及使用
Unity UGUI的Outline(描边)组件的介绍及使用 1. 什么是Outline(描边)组件? Outline(描边)组件是Unity UGUI中的一种特效组件,用于给UI元素添加描边效果。通过设置描边的颜色、宽度和模糊程度,可以使UI元素在视觉上更加突出。 2. Outline(描…...
爆改vue3 setup naiveui可编辑table
使用naiveui官网的可编辑table总是报错,所以手写了一个 思路:table数据数组unitMsgArr对应一个布尔的数组isEditArr ,点击table可编辑的行数据的时候,更改对应的isEdit为true,此时渲染组件EditCom,在EditC…...
功率放大器的种类有哪三种类型
功率放大器是一种能将输入信号转换为更高功率输出的电子设备。在电子工程和音频领域中,功率放大器通常被分为三种类型:A类、B类和AB类。下面安泰电子将详细介绍这三种类型的功率放大器及其特点。 A类功率放大器 A类功率放大器是一种基本的线性功率放大器…...
HDFS 分布式存储 spark storm HBase
HDFS 分布式存储 spark storm HBase 分布式结构 master slave name node client 负责文件的拆分 128MB 3份 data node MapReduce 分布式计算 离线计算 2.X之前 速度比较慢 对比spark 编程思想 Map 分 Reduce 合 hadoop streaming Mrjob Yarn 资源管理 cpu 内存 MapReduc…...
Vue3文字实现左右和上下滚动
可自定义设置以下属性: 滚动文字数组(sliderText),类型:Array<{title: string, link?: string}>,必传,默认[] 滚动区域宽度(width),类型:…...
Docker Sybase修改中文编码
镜像:datagrip/sybase 镜像默认用户名sa,密码myPassword,服务名MYSYBASE 1.进入容器 docker exec -it <container_name> /bin/bash2.加载Sybase环境变量 source /opt/sybase/SYBASE.sh3.查看是否安装了中文字符集 isql -Usa -PmyP…...
【SpringCloud Alibaba】(六)使用 Sentinel 实现服务限流与容错
今天,我们就使用 Sentinel 实现接口的限流,并使用 Feign 整合 Sentinel 实现服务容错的功能,让我们体验下微服务使用了服务容错功能的效果。 因为内容仅仅围绕着 SpringCloud Alibaba技术栈展开,所以,这里我们使用的服…...
mysql的主从复制
1.主从复制的原理 主从复制的原理是通过基于日志的复制方式实现数据的同步。当主服务器上发生数据变更时,会将这些变更写入二进制日志(Binary Log)中。从服务器通过连接到主服务器,请求从主服务器获取二进制日志,并将…...
【Golang 接口自动化03】 解析接口返回XML
目录 解析接口返回数据 定义结构体 解析函数: 测试 优化 资料获取方法 上一篇我们学习了怎么发送各种数据类型的http请求,这一篇我们来介绍怎么来解析接口返回的XML的数据。 解析接口返回数据 定义结构体 假设我们现在有一个接口返回的数据resp如…...
Java+bcprov库实现对称和非对称加密算法
BouncyCastle,即BC,其是一款开源的密码包,包含了大量的密码算法。 本篇主要演示BC库引入,对称加密算法AES、SM4和 非对称加密EC算法的简单实现,以下是实现过程。 一、将BC添加到JRE环境 前提:已安装JRE环…...
APK Installer:在Windows上轻松安装Android应用的完整指南
APK Installer:在Windows上轻松安装Android应用的完整指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer APK Installer是一款专为Windows系统设计的Andro…...
ADF4350频点锁定与电源滤波实战:为什么你的VCO输出有噪声?加个钽电容试试!
ADF4350频点锁定与电源滤波实战:为什么你的VCO输出有噪声?加个钽电容试试! 在射频电路设计中,ADF4350作为一款集成VCO的宽带频率合成器,因其出色的性能和灵活性广受工程师青睐。然而,许多开发者在实际应用中…...
Linux 软件包管理(含上机实例)
文章目录软件包管理一、知识要点1.rpm作用2.安装问题1:文件已被安装问题2:文件冲突问题3:未解决依赖关系3.卸载rpm包4.升级rpm包5.查询已安装的软件包的数据库6.验证软件包完整性二、YUM的使用yum简述yum命令集三、上机任务6 软件包管理 一、…...
港科大沈劭劼、谭平团队最新成果:开源280万全景数据集,实现零样本立体匹配
「一举攻克全景3D视觉两大瓶颈」 目录 01 行业痛点:数据匮乏与畸变失效的双重桎梏 1. 数据集稀缺,泛化能力受限 2. 球面畸变破坏单目先验一致性 02 核心突破:超大数据与航向对齐先验双驱动 1. 280万级合成数据集,打破数据壁…...
TVBOX最新电视直播软件tv版下载与安装教程
如何安装最新版电视直播软件tv版TVBOX?先讲清楚:TVBox 是开源播放器,本身不带影视资源,装好后必须配置 “数据源 / 接口” 才能用。下面分「下载 → 安装 → 配置 → 常见问题」一步步来。(如果不会配置,可…...
基于SpringBoot的咖啡馆会员营销系统毕业设计
博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在构建一个基于Spring Boot与Vue框架的咖啡馆会员营销系统以解决传统会员管理方式中存在的信息孤岛现象与运营效率低下问题该系统通过整合现代信息技术手…...
缙云定制木门,别只看报价,多花3000块买了教训
去年帮朋友盯装修,他图便宜选了某门店的“特价木门”,结果装上才半年,门框受潮变形、关门嘎吱响,隔音差到客厅看电视卧室听得一清二楚。最后拆掉重做,多花了3000块冤枉钱。缙云本地业主装木门,千万别踩这个…...
YOLOv11城市道路摩托车与自行车目标检测数据集-1569张-motorcycle-1_2
YOLOv11城市道路摩托车与自行车目标检测数据集 📊 数据集基本信息 目标类别: [‘bike’, ‘motorcycle’]中文类别:[‘自行车’, ‘摩托车’]训练集:1374 张验证集:130 张测试集:65 张总计:1569…...
卡尔曼滤波在目标跟踪中的应用:原理、建模与工程调参实战
1. 项目概述:从“猜”到“算”的跟踪艺术在目标跟踪这个领域,无论是自动驾驶中预测前车的轨迹,还是无人机锁定移动的物体,亦或是视频监控里框住一个行走的人,我们核心要解决的都是一个问题:如何在充满噪声和…...
保姆级教程:在Ubuntu 22.04上为DCU-Z100(ZiFang)安装ROCm 4.5.2驱动及完整工具链
国产AI加速卡DCU-Z100(ZiFang)全栈部署指南:从驱动安装到开发环境配置 在人工智能计算领域,国产硬件正逐步崭露头角。DCU-Z100(代号ZiFang)作为一款自主研发的深度学习计算单元,为开发者提供了全…...
