Go语言的100个错误使用场景(40-47)|字符串函数方法
前言
大家好,这里是白泽。 《Go语言的100个错误以及如何避免》 是最近朋友推荐我阅读的书籍,我初步浏览之后,大为惊喜。就像这书中第一章的标题说到的:“Go: Simple to learn but hard to master”,整本书通过分析100个错误使用 Go 语言的场景,带你深入理解 Go 语言。
我的愿景是以这套文章,在保持权威性的基础上,脱离对原文的依赖,对这100个场景进行篇幅合适的中文讲解。所涉内容较多,总计约 8w 字,这是该系列的第五篇文章,对应书中第40-47个错误场景。
🌟 当然,如果您是一位 Go 学习的新手,您可以在我开源的学习仓库中,找到针对 《Go 程序设计语言》 英文书籍的配套笔记,其他所有文章也会整理收集在其中。
📺 B站:白泽talk,公众号【白泽talk】,聊天交流群:622383022,原书电子版可以加群获取。
前文链接:
- 《Go语言的100个错误使用场景(1-10)|代码和项目组织》
- 《Go语言的100个错误使用场景(11-20)|项目组织和数据类型》
- 《Go语言的100个错误使用场景(21-29)|数据类型》
- 《Go语言的100个错误使用场景(30-40)|数据类型与字符串使用》
5. 字符串
🌟 章节概述:
- 了解 rune 的概念
- 避免常见的字符串遍历和截取造成的错误
- 避免由于字符串拼接和转换造成的低效代码
- 避免获取子字符串造成的内存泄漏
5.5 无用的字符串转换(#40)
错误示例:
func getBytes(reader io.Reader) ([]byte, error) {b, err := io.ReadAll(reader)if err != nil {return nil, err}// 去除首尾空格return []byte(sanitize(string(b))), nil
}
func sanitize(s string) string {return strings.TrimSpace(s)
}
正确示例:
func getBytes(reader io.Reader) ([]byte, error) {b, err := io.ReadAll(reader)if err != nil {return nil, err}// 去除首尾空格return sanitize(b), nil
}
func sanitize(b []byte) []byte {return bytes.TrimSpace(b)
}
通常来说 bytes
库提供了与 strings
库相同功能的方法,而且大多数 IO 相关的函数的输入输出都是 []byte
,而不是 string
,错误示例中,将字符切片转换成字符串,再转换成字符切片,需要额外承担两次内存分配的开销。
5.6 获取子字符串操作和内存泄漏(#41)
假设有许多个 string 类型的 log 需要存储(假设一个log有1000字节),但是只需要存放 log 的前36字节,不恰当的子字符串截取函数,会导致内存泄漏。
示例代码:
// 方式一
func (s store) handleLog(log string) error {if len(log) < 36 {return errors.New("log is not correctly formatted")}uuid := log[:36]s.store(uuid)// Do something
}
// 方式二
func (s store) handleLog(log string) error {if len(log) < 36 {return errors.New("log is not correctly formatted")}uuid := string([]byte(log[:36]))s.store(uuid)// Do something
}
// 方式三
func (s store) handleLog(log string) error {if len(log) < 36 {return errors.New("log is not correctly formatted")}uuid := strings.Clone(log[:36])s.store(uuid)// Do something
}
- 和(#26)提到的子切片获取造成的内存泄漏一样,获取子字符串操作执行后,其底层依旧依赖原来的整个字符数组,因此1000个字节内存依旧占用,不会只有36个。
- 通过将字符串转换为字节数组,再转换为字符串,虽然消耗了2次长度为36字节的内存分配,但是释放了底层1000字节的原字节数组的依赖。有些 IDE 如 Goland 会提示语法错误,因为本质来说,将 string 转 []byte 再转 string 是一个累赘的操作。
- go1.18之后,提供了一步到位的
strings.Clone
方法,可以避免内存泄漏。
6. 函数和方法
🌟 章节概述:
- 什么时候使用值或者指针类型的接受者
- 什么时候命名的返回值,以及其副作用
- 避免返回 nil 接受者时的常见错误
- 函数接受一个文件名,并不是最佳实践
- 处理 defer 的参数
6.1 不知道选择哪种类型的方法接受者(#42)
值接受者:
type customer struct {balance float64
}
func (c customer) add(operation float64) {c.balance += operation
}
func main() {c := customer{balance: 100.0}c.add(50.0)fmt.Printf("%.2f\n", c.balance) // 结果为 100.00
}
指针接受者:
type customer struct {balance float64
}
func (c *customer) add(operation float64) {c.balance += operation
}
func main() {c := customer{balance: 100.0}c.add(50.0)fmt.Printf("%.2f\n", c.balance) // 结果为 150.00
}
值接受者在方法内修改自身结构的值,不会对调用方造成实际影响。
🌟 一些实践的建议:
-
必须使用指针接受者的场景:
- 如果方法需要修改原始的接受者。
- 如果方法的接受者包含不可以被拷贝的字段。
-
建议使用指针接受者的场景:
- 如果接受者是一个巨大的对象,使用指针接受者可以更加高效,避免了拷贝内存。
-
必须使用值接受者的场景:
- 如果我们必须确保接受者是不变的。
- 如果接受者是一个 map, function, channel,否则会出现编译错误。
-
建议使用值接受者的场景:
- 如果接受者是一个切片,且不会被修改。
- 如果接受者是一个小的数组或者结构体,不含有易变的字段。
- 如果接受者是基本类型如:int, float64, string。
特殊情况:
type customer struct {data *data
}
type data struct {balance float64
}
func (c customer) add(operation float64) {c.data.balance += operation
}
func main() {c := customer{data: &data {balance: 100.0}}c.add(50.0)fmt.Printf("%.2f\n", c.data.balance) // 150.00
}
在这种情况下,即使方法接受者 c 不是指针类型,但是修改依旧可以生效。
但是为了清楚起见,通常还是将 c 声明成指针类型,如果它是可操作的。
6.2 从来不使用命名的返回值(#43)
如果使用命名返回值:
func f(a int) (b int) {b = areturn
}
推荐使用命名返回值的场景举例:
// 场景一
type locator interface {getCoordinates(address string) (lat, lng float32, err error)
}
// 场景二
func ReadFull(r io.Reader, buf []byte) (n int, err error) {// 两个返回值被初始化为对应类型的零值:0和nilfor len(buf) > 0 && err == nil {var nr intnr, err = r.Read(buf)n += nrbuf = buf[nr:]}return
}
场景一:通过命名返回值提高接口的可读性
场景二:通过命名返回值节省编码量
🌟 最佳实践:需要权衡使用命名返回值是否能带来收益,如果可以就果断使用吧!
6.3 使用命名返回值造成的意外副作用(#44)
🌟 注意:使用命名返回值的方法,并不意味着必须返回单个 return,有时可以只为了函数签名清晰而使用命名返回值。
错误场景:
func (l loc) getCoordinates(ctx content.Content, address string) (lat, lng float32, err error) {isValid := l.validateAddress(address)if !isValid {return 0, 0, errors.New("invalid address")}if ctx.Err() != nil {return 0, 0, err}// Do something and return
}
此时,由于 ctx.Err() != nil 成立时,并没有为 err 赋值,因此返回的 err 永远都是 nil。
修正方案:
func (l loc) getCoordinates(ctx content.Content, address string) (lat, lng float32, err error) {isValid := l.validateAddress(address)if !isValid {return 0, 0, errors.New("invalid address")}if err = ctx.Err(); err != nil {// 这里原则上可以返回单个return,但是最好保持风格统一return 0, 0, err}// Do something and return
}
6.4 返回一个 nil 接受者(#45)
🔔 提示:在 Go 语言当中,方法就像是函数的语法糖一样,相当于函数的第一个参数是方法的接受者,nil 可以作为参数,因此 nil 接受者可以触发方法,因此不同于纯粹的 nil interface。
type Foo struct {}
func (foo *Foo) Bar() string {return "bar"
}
func main() {var foo *Foofmt.Println(foo.Bar()) // 虽然 foo 动态值是 nil,但动态类型不是nil,是可以打印出 bar
}
错误示例:
type MultiError struct {errs []string
}
func (m *MultiError) Add(err error) {m.errs = append(m.errs, err.Error())
}
func (m *MultiError) Error() string {return stirngs.Join(m.errs, ";")
}
func (c Customer) Validate() error {var m *MultiErrorif c.Age < 0 {m = &MultiError{}m.Add(errors.New("age is negative"))}if c.Name == "" {if m == nil {m = &MultiError{}}m.Add(errors.New("age is nil"))}return m
}
func main() {// 传入的两个参数都不会触发 Validate 的 err 校验customer := Customer{Age: 33, Name: "John"}if err := customer.Validate(); err != nil {// 但是无论如何都会打印这行语句,err != nil 永远成立!log.Fatalf("customer is invalid: %v", err)}
}
🔔 提示:Go 语言的接口,有动态类型和动态值两个概念,
上述错误示例中,即使通过了两个验证,Validate 返回了 m,此时这个接口承载的动态类型是 *MultiError,它的动态值是 nil,但是通过 == 判断一个 err 为 nil,或者说一个接口为 nil,要求其底层类型和值都是 nil 才会成立。
正确方案:
func (c Customer) Validate() error {var m *MultiErrorif c.Age < 0 {m = &MultiError{}m.Add(errors.New("age is negative"))}if c.Name == "" {if m == nil {m = &MultiError{}}m.Add(errors.New("age is nil"))}if m != nil {return m}return nil
}
此时返回的是一个 nil interface,是存粹的。而不是一个非 nil 动态类型的 interfere 返回值。
6.5 使用文件名作为函数的输入(#46)
编写一个从文件中按行读取内容的函数。
错误示例:
func countEmptyLinesInFile(filename string) (int, error) {file, err := os.Open(filename)if err != nil {return 0, err}scanner := bufio.NewScanner(file)for scanner.Scan() {// ...}
}
弊端:
- 每当需要做不同功能的单元测试,需要单独创建一个文件。
- 这个函数将无法被复用,因为它依赖于一个具体的文件名,如果是从其他输入源读取将需要重新编写函数。
🌟 修正方案:
func countEmptyLines(reader io.Reader) (int, error) {scanner := bufio.NewScanner(reader)for scanner.Scan() {// ...}
}
func TestCountEmptyLines(t *testing.T) {emptyLines, err := countEmptyLines(strings.NewReader(`foobarbaz`))// 测试逻辑
}
通过这种方式,可以将输入源进行抽象,从而满足来自任何输入的读取(文件,字符串,HTTP Request,gRPC Request等),编写单元测试也十分便利。
6.6 不理解 defer 参数和接收者是如何确定的(#47)
- defer 声明的函数的参数值,在声明时确定:
const (StatusSuccess = "success"StatusErrorFoo = "error_foo"StatusErrorBar = "error_bar"
)
func f() error {var status stringdefer notify(status)defer incrementCounter(status)if err := foo(); err != nil {status = StatusErrorFooreturn err}if err := bar(); err != nil {status = StatusErrorBarreturn err}status = StatusSuccessreturn nil
}
🌟 上述示例中,无论是否会在 foo
和 bar
函数的调用后返回 err
,status
的值传递给 notify
和 incrementCount
函数的都是空字符串,因为 defer 声明的函数的参数值,在声明时确定。
修正方案1:
func f() error {var status string// 修改为传递地址defer notify(&status)defer incrementCounter(&status)if err := foo(); err != nil {status = StatusErrorFooreturn err}if err := bar(); err != nil {status = StatusErrorBarreturn err}status = StatusSuccessreturn nil
}
因为地址一开始确定,所以无论后续如何为 status 赋值,都可以通过地址获取到最新的值。这种方式的缺点是需要修改 notify 和 incrementCounter 两个函数的传参形式。
🌟 defer 声明一个闭包,则闭包内使用的外部变量的值,将在闭包执行的时候确定。
func main() {i := 0j := 0defer func(i int) {fmt.Println(i, j)}(i)i++j++
}
因为 i 作为匿名函数的参数传入,因此值在一开始确定,而 j 是闭包内使用外部的变量,因此在 return 之前确定值。最后打印结果 i = 0, j = 1。
修正方案2:
func f() error {var status stringdefer func() {notify(status)incrementCounter(status)}()
}
通过使用闭包将 notify 和 incrementCounter 函数包裹,则 status 的值使用闭包外侧的变量 status,因此 status 的值会在闭包执行的时候确定,这种修改方式也无需修改两个函数的签名,更为推荐。
- 指针和值接收者:
值接收者:
func main() {s := Struct{id: "foo"}defer s.print()s.id = "bar"
}
type Struct struct {id string
}
func (s Struct) print() {fmt.Println(s.id)
}
打印的结果是 foo,因为 defer 后声明的 s.print() 的接收者 s 将在一开始获得一个拷贝,foo 作为 id 已经固定。
指针接收者:
func main() {s := &Struct{id: "foo"}defer s.print()s.id = "bar"
}
type Struct struct {id string
}
func (s *Struct) print() {fmt.Println(s.id)
}
打印结果是 bar,defer 后声明的 s.print() 的接收者 s 将在一开始获得一份拷贝,因为是地址的拷贝,所以对 return 之前的改动有感知。
小结
已完成《Go语言的100个错误》全书学习进度47%,欢迎追更。
相关文章:

Go语言的100个错误使用场景(40-47)|字符串函数方法
前言 大家好,这里是白泽。 《Go语言的100个错误以及如何避免》 是最近朋友推荐我阅读的书籍,我初步浏览之后,大为惊喜。就像这书中第一章的标题说到的:“Go: Simple to learn but hard to master”,整本书通过分析100…...

Fluke ADPT 连接器新增对福禄克万用 Fluke 15B Max 的支持
所需设备: 1、Fluke ADPT连接器; 2、Fluke 15B Max; Fluke 15B Max拆机图: 显示界面如下图: 并且可以将波形导出到EXCEL: 福禄克万用表需要自己动手改造!!!...

前端工程化面试题 | 10.精选前端工程化高频面试题
🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…...

【并发编程】AQS原理
📝个人主页:五敷有你 🔥系列专栏:并发编程 ⛺️稳中求进,晒太阳 1. 概述 全称是 AbstractQueuedSynchronizer,是阻塞式锁和相关的同步器工具的框架 特点: 用 state 属性来表示资源的状…...

AI:130-基于深度学习的室内导航与定位
🚀点击这里跳转到本专栏,可查阅专栏顶置最新的指南宝典~ 🎉🎊🎉 你的技术旅程将在这里启航! 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 ✨✨✨ 每一个案例都附带有在本地跑过的关键代码,详细讲解供…...

Leetcode1423.可获得的最大点数
文章目录 题目原题链接思路(逆向思维) 题目 原题链接 Leetcode1423.可获得的最大点数 思路(逆向思维) 由题目可知,从两侧选k张,总数为n张,即从中间选n - k张 nums总和固定,要选k张最…...

深度学习之梯度下降算法
梯度下降算法 梯度下降算法数学公式结果 梯度下降算法存在的问题随机梯度下降算法 梯度下降算法 数学公式 这里案例是用梯度下降算法,来计算 y w * x 先计算出梯度,再进行梯度的更新 import numpy as np import matplotlib.pyplot as pltx_data [1.0,…...

代码随想录第32天|● 122.买卖股票的最佳时机II ● 55. 跳跃游戏 ● 45.跳跃游戏II
文章目录 买卖股票思路一:贪心代码: 思路:动态规划代码: 跳跃游戏思路:贪心找最大范围代码: 跳跃游戏②思路:代码: 方法二:处理方法一的特殊情况 买卖股票 思路一&#x…...

线性代数的本质 2 线性组合、张成的空间、基
基于3Blue1Brown视频的笔记 一种新的看待方式 对于一个向量,比如说,如何看待其中的3和-2? 一开始,我们往往将其看作长度(从向量的首走到尾部,分别在x和y上走的长度)。 在有了数乘后࿰…...

- 工程实践 - 《QPS百万级的有状态服务实践》01 - 存储选型实践
本文属于专栏《构建工业级QPS百万级服务》 《QPS百万级的无状态服务实践》已经完成。截止目前为止,支持需求“给系统传入两个日期,计算间隔有多少天”的QPS百万级服务架构已经完成。如图1: 图1 可是这个架构不能满足需求“给系统传入两个日期…...

SECS/GEM的HSMS通讯?金南瓜方案
High Speed SECS Message Service (HSMS) 是一种基于 TCP/IP 的协议,它使得 SECS 消息通信更加快速。这通常用作设备间通信的接口。 HSMS 状态逻辑变化(序列): 1.Not Connected:准备初始化 TCP/IP 连接,但尚…...

wayland(xdg_wm_base) + egl + opengles——dma_buf 作为纹理数据源(五)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、EGL dma_buf import 相关的数据结构和函数1. EGLImageKHR2. eglCreateImageKHR()3. glEGLImageTargetTexture2DOES()二、egl 中 import dma_buf 作为纹理的代码实例1. egl_wayland_dmabuf_…...
【VTKExamples::PolyData】第二十八期 LinearExtrusion
很高兴在雪易的CSDN遇见你 VTK技术爱好者 QQ:870202403 前言 本文分享VTK样例LinearExtrusion,并解析接口vtkLinearExtrusionFilter,希望对各位小伙伴有所帮助! 感谢各位小伙伴的点赞+关注,小易会继续努力分享,一起进步! 你的点赞就是我的动力(^U^)ノ~YO 目录…...

Linux操作系统基础(五):Linux的目录结构
文章目录 Linux的目录结构 一、Linux目录与Windows目录区别 二、常见目录介绍(记住重点) Linux的目录结构 一、Linux目录与Windows目录区别 Linux的目录结构是一个树型结构 Windows 系统 可以拥有多个盘符, 如 C盘、D盘、E盘 Linux 没有盘符 这个概…...

SolidWorks如何在一个零件的基础上绘制另一个零件
经过测试,新建零件,然后插入零件a,在a的基础上绘制b,这种做法无法断开a与b的联系。虽然可以通过切除命令,切除b,但不是正途。 在装配体中可以实现: (1)建立装配体 (2&…...
gin(结)
gin day1 今天的目标就是学懂,看懂每一步代码。 gin框架 gin框架就是go语言的web框架。框架你也可以理解成一个库。里面有一堆封装好的工具,帮你实现各种各样的功能,这样使得你可以关注业务本身,而在写代码上少费力。 快速入门&…...
JavaScript 设计模式之桥接模式
桥接模式 通过桥接模式,我们可以将业务逻辑与元素的事件解耦,也可以更灵活的创建一些对象 倘若我们有如下代码 const dom document.getElementById(#test)// 鼠标移入移出事件 // 鼠标移入时改变背景色和字体颜色 dom.onmouseenter function() { th…...
B3651 [语言月赛202208] 数组调整
题目描述 给出一个长度为 n 的数组,第 i 个数为ai。 为了调整这个数组,需要将第 k 个数改变为 −ak。 请你求出调整后的数组中所有数的和。 输入格式 输入共两行。 输入的第一行为两个整数 n,k。 输入的第二行为 n 个整数,第 i 个…...

MessageQueue --- RabbitMQ
MessageQueue --- RabbitMQ RabbitMQ IntroRabbitMQ 核心概念RabbitMQ 分发类型Dead letter (死信)保证消息的可靠传递 RabbitMQ Intro 2007年发布,是一个在AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,…...

WordPress作者页面链接的用户名自动变成16位字符串串插件Smart User Slug Hider
WordPress默认的作者页面URL链接地址格式为“你的域名/author/admin”,其中admin就是你的用户名,这样的话就会暴露我们的用户名。 为了解决这个问题,前面boke112百科跟大家分享了『如何将WordPress作者存档链接中的用户名改为昵称或ID』一文…...

[论文阅读] 人工智能 | 利用负信号蒸馏:用REDI框架提升LLM推理能力
【论文速读】利用负信号蒸馏:用REDI框架提升LLM推理能力 论文信息 arXiv:2505.24850 cs.LG cs.AI cs.CL Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning Authors: Shuyao Xu, Cheng Peng, Jiangxuan Long, Weidi…...
GPU集群故障分析:大型AI训练中的硬件问题与影响
GPU集群故障分析:大型AI训练中的硬件问题与影响 核心问题 在大型AI计算集群(如使用上千块GPU卡训练大模型)中: GPU硬件会出哪些毛病?这些问题发生的频率、严重程度如何?最终对AI训练任务有什么影响&#…...

作为过来人,浅谈一下高考、考研、读博
写在前面 由于本人正在读博,标题中的三个阶段都经历过或正在经历,本意是闲聊,也算是给将要经历的读者们做个参考、排雷。本文写于2022年,时效性略有落后,不过逻辑上还是值得大家参考,若所述存在偏颇&#…...

重构城市应急指挥布控策略 ——无人机智能视频监控的破局之道
在突发事件、高空巡查、边远区域布控中,传统摄像头常常“看不到、跟不上、调不动”。无人机智能视频监控系统,打破地面视角局限,以“高空布控 AI分析 实时响应”赋能政企单位智能化管理。在城市应急指挥中心的大屏上,一场暴雨正…...
如何从零开始建设一个网站?
当你没有建站的基础和建站的知识,那么应该如何开展网站建设和网站管理。而今天的教程是不管你是为自己建站还是为他人建站都适合的。本教程会指导你如何进入建站,将建站的步骤给大家分解: 首先我们了解一下,建站需要那些步骤和流程…...

day029-Shell自动化编程-计算与while循环
文章目录 1. read 交互式初始化变量1.1 案例-安装不同的软件1.2 案例-比较大小 2. 计算2.1 bc2.2 awk2.3 expr2.4 let2.5 案例-计算内存的空闲率2.6 案例-检查域名过期时间和https整数过期时间 3. 循环3.1 循环控制语句3.2 for循环-c语言格式3.3 while循环3.3.1 案例-猜数字3.3…...

Vue-3-前端框架Vue基础入门之VSCode开发环境配置和Tomcat部署Vue项目
文章目录 1 安装配置VSCode1.1 安装中文语言插件1.2 主题颜色1.3 禁用自动更新1.4 开启代码提示设置1.5 安装open in browser插件2 安装配置nodejs2.1 配置环境变量2.2 npm与maven的区别2.3 使用npm避坑3 创建Vue项目3.1 两种创建方式3.2 package.json3.3 安装新的依赖3.4 运行…...
【强化学习】——03 Model-Free RL之基于价值的强化学习
【强化学习】——03 Model-Free RL之基于价值的强化学习 \quad\quad \quad\quad 动态规划算法是基于模型的算法,要求已知状态转移概率和奖励函数。但很多实际问题中环境 可能是未知的,这就需要不基于模型(Model-Free)的RL方法。 \quad\quad 其又分为: 基于价值(Valu…...
【 java 集合知识 第一篇 】
目录 1.概念 1.1.集合与数组的区别 1.2.集合分类 1.3.Collection和Collections的区别 1.4.集合遍历的方法 2.List 2.1.List的实现 2.2.可以一边遍历一边修改List的方法 2.3.List快速删除元素的原理 2.4.ArrayList与LinkedList的区别 2.5.线程安全 2.6.ArrayList的扩…...

(nice!!!)(LeetCode每日一题)2434. 使用机器人打印字典序最小的字符串(贪心+栈)
题目:2434. 使用机器人打印字典序最小的字符串 思路:贪心栈,时间复杂度0(n)。 字符串t其实就是栈,后进先出。要让p的字典序最小,那当然是t每次弹出的字符,都小于或等于“剩下未入t里的字符串的字符”&#…...