Go基础—反射,性能和灵活性的双刃剑
Go基础—反射,性能和灵活性的双刃剑
- 1 简介
- 2 结构体成员赋值对比
- 3 结构体成员搜索并赋值对比
- 4 调用函数对比
- 5 基准测试结果对比
1 简介
现在的一些流行设计思想需要建立在反射基础上,如控制反转(Inversion Of Control,IOC)和依赖注入(Dependency Injection,DI)。
Go 语言中非常有名的 Web 框架 martini(https://github.com/go-martini/martini)就是通过依赖注入技术进行中间件的实现,例如使用 martini 框架搭建的 http 的服务器如下:
package mainimport "github.com/go-martini/martini"func main() {m := martini.Classic()m.Get("/", func() string {return "Hello world!"})m.Run()
}
第 7 行,响应路径/的代码使用一个闭包实现。如果希望获得 Go 语言中提供的请求和响应接口,可以直接修改为:
m.Get("/", func(res http.ResponseWriter, req *http.Request) string {// 响应处理代码……
})
martini 的底层会自动通过识别 Get 获得的闭包参数情况,通过动态反射调用这个函数并传入需要的参数。martini 的设计广受好评,但同时也有人指出,其运行效率较低。其中最主要的因素是大量使用了反射。
虽然一般情况下,I/O 的延迟远远大于反射代码所造成的延迟。但是,更低的响应速度和更低的 CPU 占用依然是 Web 服务器追求的目标。因此,反射在带来灵活性的同时,也带上了性能低下的桎梏。
要用好反射这把双刃剑,就需要详细了解反射的性能。下面的一些基准测试从多方面对比了原生调用和反射调用的区别。
2 结构体成员赋值对比
反射经常被使用在结构体上,因此结构体的成员访问性能就成为了关注的重点。下面例子中使用一个被实例化的结构体,访问它的成员,然后使用 Go 语言的基准化测试可以迅速测试出结果。
反射性能测试的完整代码位于./src/chapter12/reflecttest/reflect_test.go,下面是对各个部分的详细说明。
本套教程所有源码下载地址:https://pan.baidu.com/s/1ORFVTOLEYYqDhRzeq0zIiQ,提取密码:hfyf
原生结构体的赋值过程:
// 声明一个结构体, 拥有一个字段
type data struct {Hp int
}func BenchmarkNativeAssign(b *testing.B) {// 实例化结构体v := data{Hp: 2}// 停止基准测试的计时器b.StopTimer()// 重置基准测试计时器数据b.ResetTimer()// 重新启动基准测试计时器b.StartTimer()// 根据基准测试数据进行循环测试for i := 0; i < b.N; i++ {// 结构体成员赋值测试v.Hp = 3}}
代码说明如下:
- 第 2 行,声明一个普通结构体,拥有一个成员变量。
- 第 6 行,使用基准化测试的入口。
- 第 9 行,实例化 data 结构体,并给 Hp 成员赋值。
- 第 12~17 行,由于测试的重点必须放在赋值上,因此需要极大程度地降低其他代码的干扰,于是在赋值完成后,将基准测试的计时器复位并重新开始。
- 第 20 行,将基准测试提供的测试数量用于循环中。
- 第 23 行,测试的核心代码:结构体赋值。
接下来的代码分析使用反射访问结构体成员并赋值的过程。
func BenchmarkReflectAssign(b *testing.B) {v := data{Hp: 2}// 取出结构体指针的反射值对象并取其元素vv := reflect.ValueOf(&v).Elem()// 根据名字取结构体成员f := vv.FieldByName("Hp")b.StopTimer()b.ResetTimer()b.StartTimer()for i := 0; i < b.N; i++ {// 反射测试设置成员值性能f.SetInt(3)}
}
代码说明如下:
- 第 6 行,取v的地址并转为反射值对象。此时值对象里的类型为
*data,使用值的Elem()方法取元素,获得 data 的反射值对象。 - 第 9 行,使用
FieldByName()根据名字取出成员的反射值对象。 - 第 11~13 行,重置基准测试计时器。
- 第 18 行,使用反射值对象的
SetInt()方法,给data结构的Hp字段设置数值 3。
这段代码中使用了反射值对象的 SetInt() 方法,这个方法的源码如下:
func (v Value) SetInt(x int64) {v.mustBeAssignable()switch k := v.kind(); k {default:panic(&ValueError{"reflect.Value.SetInt", v.kind()})case Int:*(*int)(v.ptr) = int(x)case Int8:*(*int8)(v.ptr) = int8(x)case Int16:*(*int16)(v.ptr) = int16(x)case Int32:*(*int32)(v.ptr) = int32(x)case Int64:*(*int64)(v.ptr) = x}
}
可以发现,整个设置过程都是指针转换及赋值,没有遍历及内存操作等相对耗时的算法。
3 结构体成员搜索并赋值对比
func BenchmarkReflectFindFieldAndAssign(b *testing.B) {v := data{Hp: 2}vv := reflect.ValueOf(&v).Elem()b.StopTimer()b.ResetTimer()b.StartTimer()for i := 0; i < b.N; i++ {// 测试结构体成员的查找和设置成员的性能vv.FieldByName("Hp").SetInt(3)}}
这段代码将反射值对象的 FieldByName() 方法与 SetInt() 方法放在循环里进行检测,主要对比测试FieldByName()方法对性能的影响。FieldByName()方法源码如下:
func (v Value) FieldByName(name string) Value {v.mustBe(Struct)if f, ok := v.typ.FieldByName(name); ok {return v.FieldByIndex(f.Index)}return Value{}
}
底层代码说明如下:
- 第 3 行,通过名字查询类型对象,这里有一次遍历过程。
- 第 4 行,找到类型对象后,使用
FieldByIndex()继续在值中查找,这里又是一次遍历。
经过底层代码分析得出,随着结构体字段数量和相对位置的变化,FieldByName() 方法比较严重的低效率问题。
4 调用函数对比
反射的函数调用,也是使用反射中容易忽视的性能点,下面展示对普通函数的调用过程。
// 一个普通函数
func foo(v int) {}func BenchmarkNativeCall(b *testing.B) {for i := 0; i < b.N; i++ {// 原生函数调用foo(0)}
}func BenchmarkReflectCall(b *testing.B) {// 取函数的反射值对象v := reflect.ValueOf(foo)b.StopTimer()b.ResetTimer()b.StartTimer()for i := 0; i < b.N; i++ {// 反射调用函数v.Call([]reflect.Value{reflect.ValueOf(2)})}
}
代码说明如下:
- 第 2 行,一个普通的只有一个参数的函数。
- 第 10 行,对原生函数调用的性能测试。
- 第 17 行,根据函数名取出反射值对象。
- 第 25 行,使用
reflect.ValueOf(2)将2构造为反射值对象,因为反射函数调用的参数必须全是反射值对象,再使用[]reflect.Value构造多个参数列表传给反射值对象的Call()方法进行调用。
反射函数调用的参数构造过程非常复杂,构建很多对象会造成很大的内存回收负担。Call() 方法内部就更为复杂,需要将参数列表的每个值从reflect.Value类型转换为内存。调用完毕后,还要将函数返回值重新转换为reflect.Value类型返回。因此,反射调用函数的性能堪忧。
5 基准测试结果对比
测试结果如下:
$ go test -v -bench=.
goos: linux
goarch: amd64
BenchmarkNativeAssign-4 2000000000 0.32 ns/op
BenchmarkReflectAssign-4 300000000 4.42 ns/op
BenchmarkReflectFindFieldAndAssign-4 20000000 91.6 ns/op
BenchmarkNativeCall-4 2000000000 0.33 ns/op
BenchmarkReflectCall-4 10000000 163 ns/op
PASS
结果分析如下:
- 第 4 行,原生的结构体成员赋值,每一步操作耗时 0.32 纳秒,这是参考基准。
- 第 5 行,使用反射的结构体成员赋值,操作耗时 4.42 纳秒,比原生赋值多消耗 13 倍的性能。
- 第 6 行,反射查找结构体成员且反射赋值,操作耗时 91.6 纳秒,扣除反射结构体成员赋值的 4.42 纳秒还富余,性能大概是原生的 272 倍。这个测试结果与代码分析结果很接近。
SetInt的性能可以接受,但FieldByName()的性能就非常低。 - 第 7 行,原生函数调用,性能与原生访问结构体成员接近。
- 第 8 行,反射函数调用,性能差到“爆棚”,花费了 163 纳秒,操作耗时比原生多消耗 494 倍。
经过基准测试结果的数值分析及对比,最终得出以下结论:
- 能使用原生代码时,尽量避免反射操作。
- 提前缓冲反射值对象,对性能有很大的帮助。
- 避免反射函数调用,实在需要调用时,先提前缓冲函数参数列表,并且尽量少地使用返回值。

相关文章:
Go基础—反射,性能和灵活性的双刃剑
Go基础—反射,性能和灵活性的双刃剑 1 简介2 结构体成员赋值对比3 结构体成员搜索并赋值对比4 调用函数对比5 基准测试结果对比 1 简介 现在的一些流行设计思想需要建立在反射基础上,如控制反转(Inversion Of Control,IOC&#x…...
MATLAB与ROS联合仿真(慕羽☆)全套开源资料索引
自2021年9月份开始进行MATLAB与ROS联合仿真相关的研究,至2021年12月份研究基本上结束,至今,已经近两年时间,期间曾收到过很多小伙伴的私信,想让我出点教程,期间我也曾多次想要抽点时间出教程,但…...
三、深入浅出WPF之控件与布局
三、控件与布局 图形化用户界面:Graphic User Interface ,它的便捷之处在于对数据的直观性表达,把抽象性的对象通过界面的形式展现出来。很多编程都要自己的GUI工具:像java的Swing、c++的QT 、C#的winform等等. 在日常工作中我们打交道最多的控件无外乎5类: (1)布局控件…...
社群积分运营策略:增加用户忠诚度
构建稳固的用户忠诚度是企业私域营销中至关重要的一环,而社群积分运营策略成为实现这一目标的有效手段。通过巧妙利用积分激励,社群积分运营可以吸引用户积极参与,增加用户的忠诚度和活跃度。本文将深入探讨几个实用的社群积分运营策略&#…...
推荐用于学习RN原生模块开发的开源库—react-native-ble-manager
如题RN的原生模块/Native Modules的开发是一项很重要的技能,但RN官网的示例又比较简单,然后最近我接触与使用、还有阅读了react-native-ble-manager的部份源码,发现里边完全包含了一个Native Modules所涉及的知识点/技术点,故特推…...
MySQL中锁的简介——全局锁
1.锁的概述及分类 2.全局锁的介绍 给数据库加全局锁: flush tables with read lock;数据备份: mysqldump备份指令 root用户名 1234 密码 itcast数据库名称 itcast.sql备份文件名称 mysqldump -uroot -p1234 itcast >itcast.sql;数据库全局锁解锁&am…...
RocketMQ集群4.9.2升级4.9.6版本
本文主要记录生产环境短暂停机升级RocketMQ版本的过程 一、整体思路 1.将生产环境MQ4.9.2集群同步到测试环境,并启动,确保正常运行。 2.参照4.9.2配置4.9.6集群 3.停掉4.9.2集群,启动4.9.6集群,测试确保正常运行。 4.停掉4.9.6集…...
具身智能controller---RT-1(Robotics Transformer)(上---方法介绍)
具身智能controller---RT-1(Robotics Transformer)(上---方法介绍) 相关链接摘要和简介相关工作与预备知识系统概述模型 RT-1: ROBOTICS TRANSFORMER模型 相关链接 github链接 主页链接(包括论文和训练数据集…...
视频内存过大如何压缩变小?这个压缩方法了解一下
在日常生活中,不管是日常随手拍的视频还是在工作中遇到的视频文件,在编辑处理的时候,如果视频的内存过大,不仅会占用很大的内存,在传送的时候也会花费很长时间,这时候将视频给压缩一下就可以很好的解决这一…...
【Ansible】自动化部署工具-----Ansible
自动化部署工具-Ansible 1.Ansible概述2.ansible环境安装部署2.1 command模块2.2 shell模块2.3 cron模块2.4 user模块2.5 group模块2.6 copy模块2.7 file模块2.8 hostname模块2.9 ping模块2.10 yum模块2.11 service/systemd模块2.12 script模块2.13 mount模块2.14 archive模块2…...
Ubuntu下安装Node.js;npm
Ubuntu下安装Node.js curl -sL https://deb.nodesource.com/setup_8.x | sudo -E bash - sudo apt-get install -y nodejs Ubuntu下安装npm sudo apt-get install npm Ubuntu下指定版本升级npm sudo npm install npm8.15.0 -g Ubuntu下升级node 安装n模块:s…...
设计模式-模版方法模式
生活中处处存在模版,模版定义了大的框架,具体内容由使用者填充即可,这给很多人的生活、工作带来了很大的遍历。比如: PPT模版:好的PPT模版提供了更全面的叙述框架,更优美的UI画面&图标,提升…...
Linux 学习记录59(ARM篇)
Linux 学习记录59(ARM篇) 本文目录 Linux 学习记录59(ARM篇)一、IIC总线1. 概念2. IIC总线硬件连接 二、系统框图三、IIC时序1. 起始信号 / 停止信号2. 数据传输信号3. 应答信号 / 非应答信号4. 寻址信号 四、IIC协议1. 主机给从机发送一个字节(写)2. 主机给从机发送多个连续字…...
TypeScript -- 函数
文章目录 TypeScript -- 函数JS -- 函数的两种表现形式函数声明函数的表达式es6 箭头函数 TS -- 定义一个函数TS -- 函数声明使用接口(定义)ts 定义参数可选参数写法 -- ?的使用TS函数 -- 设置剩余参数函数重载 TypeScript – 函数 JS – 函数的两种表现形式 我们熟知js有两…...
网页开发基础——HTML
一、flask框架 Flask是一种轻量级的Python web应用程序框架,可以帮助使用者快速构建Web应用程序和API。由于其简洁、灵活和易于上手的特点,Flask被广泛用于开发小型到中型的Web应用程序和后端API。本次我们主要是使用flask框架,进行一个小型w…...
C# 继承,封装,多态等知识点
一:面向对象的三大特征:继承性,封装性,多态性 1:继承性:继承主要描述是类与类之间的关系,通过继承可以在无需重新编写原有的类的情况下,对原有的类的功能进行扩展。 2:封…...
决策树概述
文章目录 决策树介绍1.介绍**决策树API:**构建决策树的三个步骤决策树的优缺点通过sklearn实现决策树分类并进一步认识决策树2. ID3 决策树1. 信息熵2. 信息增益**定义:****根据信息增益选择特征方法是:****算法:**3. ID3算法步骤4. 例子:3. C4.5 决策树1. 信息增益率计算…...
青枫壁纸小程序V1.4.0(后端SpringBoot)
引言 那么距离上次的更新已经过去了5个多月,期间因为忙着毕业设计的原因,更新的速度变缓了许多。所以,这次的更新无论是界面UI、用户功能、后台功能都有了非常大的区别。希望这次更新可以给用户带来更加好的使用体验 因为热爱,更…...
Error: unknown flag: --export 【k8s,kubernets报错】
报错情况如下: [rootk8smaster ~]# kubectl get deploy nginx -oyaml --export > my2.yaml Error: unknown flag: --export See kubectl get --help for usage.原因: --export在所使用的版本中已被移除 解决:去除--export即可,…...
进入linux系统中修改网段-ip
第一步 :开启虚拟机 cd 到 /etc/sysconfig/network-scripts 目录下,输入命令给ls,展示这个目录下文件和文件夹 第二步:进入到以ifcfg开头的文件 # ifcfg开头的文件,如果有多个网卡,有多个ifcfg-ensxx文件 命令…...
谷歌浏览器插件
项目中有时候会用到插件 sync-cookie-extension1.0.0:开发环境同步测试 cookie 至 localhost,便于本地请求服务携带 cookie 参考地址:https://juejin.cn/post/7139354571712757767 里面有源码下载下来,加在到扩展即可使用FeHelp…...
Java如何权衡是使用无序的数组还是有序的数组
在 Java 中,选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南: ⚖️ 核心权衡维度 维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...
java 实现excel文件转pdf | 无水印 | 无限制
文章目录 目录 文章目录 前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解 二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件 总结 前言 java处理excel转pdf一直没找到什么好用的免费jar包工具,自己手写的难度,恐怕高级程序员花费一年的事件,也…...
抖音增长新引擎:品融电商,一站式全案代运营领跑者
抖音增长新引擎:品融电商,一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中,品牌如何破浪前行?自建团队成本高、效果难控;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...
什么是EULA和DPA
文章目录 EULA(End User License Agreement)DPA(Data Protection Agreement)一、定义与背景二、核心内容三、法律效力与责任四、实际应用与意义 EULA(End User License Agreement) 定义: EULA即…...
C++中string流知识详解和示例
一、概览与类体系 C 提供三种基于内存字符串的流,定义在 <sstream> 中: std::istringstream:输入流,从已有字符串中读取并解析。std::ostringstream:输出流,向内部缓冲区写入内容,最终取…...
USB Over IP专用硬件的5个特点
USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中,从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备(如专用硬件设备),从而消除了直接物理连接的需要。USB over IP的…...
C++使用 new 来创建动态数组
问题: 不能使用变量定义数组大小 原因: 这是因为数组在内存中是连续存储的,编译器需要在编译阶段就确定数组的大小,以便正确地分配内存空间。如果允许使用变量来定义数组的大小,那么编译器就无法在编译时确定数组的大…...
计算机基础知识解析:从应用到架构的全面拆解
目录 前言 1、 计算机的应用领域:无处不在的数字助手 2、 计算机的进化史:从算盘到量子计算 3、计算机的分类:不止 “台式机和笔记本” 4、计算机的组件:硬件与软件的协同 4.1 硬件:五大核心部件 4.2 软件&#…...
OD 算法题 B卷【正整数到Excel编号之间的转换】
文章目录 正整数到Excel编号之间的转换 正整数到Excel编号之间的转换 excel的列编号是这样的:a b c … z aa ab ac… az ba bb bc…yz za zb zc …zz aaa aab aac…; 分别代表以下的编号1 2 3 … 26 27 28 29… 52 53 54 55… 676 677 678 679 … 702 703 704 705;…...
