当前位置: 首页 > news >正文

Golang实践录:一个字符串比较示例

本文介绍两个含中文的字符串且针对相同位置字符的比较,给出实现代码。

起因

某工程需将接收的字符串和数据库里的指定字段值对比,该字符串含中文,两者允许个别字符有差异,差异数量3及以下的,认为相同。

字符串默认用 string,于是想当然使用循环遍历,逐个字符对比之,还使用了strings.EqualFold函数,测试才发现,如果是有中文的话,结果不准确。

分析

Golang 语言的中文使用 uf-8存储,其长度并不固定。以字符串岑溪450481芩溪458481为例,肉眼可见,长度均为8,第一个中文和第三个数字不同,因此差异数量为2,按需求,应认为两个字符串相同。但用 string 对比,结果是不相同,将所有字符打印如下:

次数 字符1 字符2 字符1 字符2
[0] å è 229 232
[1] ²  178 138
[2]  © 145 169
[3] æ æ 230 230
[4] º º 186 186
[5] ª ª 170 170
[6] 4 4 52 52
[7] 5 5 53 53
[8] 0 8 48 56
[9] 4 4 52 52
[10] 8 8 56 56
[11] 1 1 49 49

可以看到,上述字符串的长度为12,共有4个地方不同,因此对比后认为不相同。

而用 rune 类型存储,再对比,所有字符如下:

次数 字符1 字符2 字符1 字符2
[0] 岑 芩 23697 33449
[1] 溪 溪 28330 28330
[2] 4 4 52 52
[3] 5 5 53 53
[4] 0 8 48 56
[5] 4 4 52 52
[6] 8 8 56 56
[7] 1 1 49 49

可以看到,字符串长度为8,和肉眼认为的一致,共有2个地方不同,因此对比后认为相同。

测试

函数封装如下:

func String2Rune(src string) (dest []rune) {for _, item := range src {dest = append(dest, item)}return
}func checkString(aaa_str, bbb_str string) bool {sameCnt := 0// 用此法对比不准确if len(aaa_str) == len(bbb_str) {for i := 0; i < len(bbb_str); i++ {if strings.EqualFold(string(aaa_str[i]), string(bbb_str[i])) {sameCnt++}}}if sameCnt >= len(bbb_str)-3 {return true}return false
}func checkRune(aaa_str, bbb_str string) bool {sameCnt := 0// 如有中文,用rune类型aa_str := String2Rune(aaa_str)bb_str := String2Rune(bbb_str)if len(aa_str) == len(bb_str) {for i := 0; i < len(aa_str); i++ {if aa_str[i] == bb_str[i] {sameCnt++}}}if sameCnt >= len(bb_str)-3 {return true}return false
}

为测试对比,设置对比两组数据,以人易理解角度看,分别相差0、1、2、3、4个字符,由实现代码如,相差3及以下字符认为相等,因此只有最后的一项数据不同。

代码如下:

func TestStringNum(t *testing.T) {var a []string = []string{"岑溪450481", "岑溪450481", "岑溪450481", "岑溪450481", "岑溪450481"}var b []string = []string{"岑溪450481", "芩溪450481", "芩溪458481", "梧州450487", "梧州458487"}for i := 0; i < len(a); i++ {fmt.Printf("%v string result: %v %v\n", i, checkString(a[i], b[i]), checkRune(a[i], b[i]))}
}

测试结果如下:

go test -run TestStringNum
0 string result: true true
1 string result: true true
2 string result: false true
3 string result: false true
4 string result: false false
PASS

小结

如涉及中文字符,因为utf8字符长度不固定,最好用rune类型比较。

李迟 2023.02.20

相关文章:

Golang实践录:一个字符串比较示例

本文介绍两个含中文的字符串且针对相同位置字符的比较&#xff0c;给出实现代码。 起因 某工程需将接收的字符串和数据库里的指定字段值对比&#xff0c;该字符串含中文&#xff0c;两者允许个别字符有差异&#xff0c;差异数量3及以下的&#xff0c;认为相同。 字符串默认用…...

Linux后台开发工具箱-葵花宝典

目录目录 11. 前言 52. 脚本类工具 52.1. 双引号和单引号 52.2. 环境变量和变量 52.3. sed命令-字符串文本操作 62.4. sed和awk使用外部变量 62.5. awk 应用 62.5.1. awk给外部变量赋值 62.5.2. awk 多字符串分割 72.6. 日期操作 72.7. 设置shell模式 82.8. 设置shell提示 82.9…...

http的请求上下文

1.引入&#xff1a; 上下文是指HTTP框架为每个HTTP请求所准备的结构体。 HTTP框架定义的这个上下文是针对于HTTP请求的&#xff0c; 而且一个HTTP请求对应于每一个HTTP模块都可以有一个独立的上下文结构体&#xff08;并不是一个请求的上下文由所有HTTP模块共用&#xff09; 。…...

【MySQL】MySQL表的增删改查(进阶)

✨个人主页&#xff1a;bit me&#x1f447; ✨当前专栏&#xff1a;MySQL数据库&#x1f447; ✨算法专栏&#xff1a;算法基础&#x1f447; ✨每日一语&#xff1a;悟已往之不谏&#xff0c;知来者之可追。实迷途其未远&#xff0c;觉今是而昨非。 目 录&#x1f384;一. 数…...

C++ Primer Plus习题及答案-第十八章

习题选自&#xff1a;C Primer Plus(第六版) 内容仅供参考&#xff0c;如有错误&#xff0c;欢迎指正 ! C decltype和返回类型后置 左右值引用和移动语义 C11 新的类功能 C11 Lambda表达式 C11 包装器function 复习题 1. 使用用大括号括起的初始化列表语法重写下述代码。重写后…...

Redis事务控制

1.Redis事务控制的相关命令 命令名作用MULTI表示开始收集命令&#xff0c;后面所有命令都不是马上执行&#xff0c;而是加入到一个队列中。EXEC执行MULTI后面命令队列中的所有命令。DISCARD放弃执行队列中的命令。WATCH“观察“、”监控“一个KEY&#xff0c;在当前队列外的其…...

Springcloud OpenFeign 详解

一、概述OpenFeign是springcloud在Feign的基础上支持了SpringMVC的注解&#xff0c;整合了hystrix&#xff0c;同时&#xff0c;可以和Eureka和ribbon配合使用&#xff0c;如RequestMapping等等。OpenFeign的FeignClient可以解析SpringMVC的RequestMapping注解下的接口&#xf…...

软件测试期末

考原题就是爽 软件测试技术 知识点整理 https://wenku.baidu.com/view/524c900f4b2fb4daa58da0116c175f0e7cd11913.html 关键知识点 https://www.cnblogs.com/whylaughing/category/813559.html?page1 边界值法不选择无效数据 边界值分析法的基本思想 选取正好等于&am…...

关于Java的深拷贝和浅拷贝

文章目录1.拷贝的引入1.1引用拷贝1.2对象拷贝2.深拷贝与浅拷贝2.1浅拷贝2.2深拷贝1.拷贝的引入 1.1引用拷贝 创建一个指向对象的引用变量的拷贝 Teacher teacher new Teacher("Taylor",26); Teacher otherteacher teacher; System.out.println(teacher); System…...

固定值电阻的检测方法总结

🏡《总目录》 目录 1,概述2,测量方法3,检测方法3.1,读值3.2,测量3.3,排故4,总结1,概述 本文简单总结固定值电阻的测量与检查方法要点和注意事项。 2,测量方法 对于固定值电阻的测量来讲,直接将万用表红黑表笔分别插入到如下图所示的红色和黑色接线端。然后将万用表…...

打印机相关

打印机相关 打印机协议 ipp,printer-job-language,lpd协议。他们的默认端口分别是631,9100和515. printer-job-language(RAW协议) 9100端口的printer-job-language,又称为RAW协议。目前遇到的问题是,此端口发送数据,打印机直接打印,除非发送正确的printer-job-lan…...

入门力扣自学笔记235 C++ (题目编号:2347)

2347. 最好的扑克手牌 题目&#xff1a; 给你一个整数数组 ranks 和一个字符数组 suit 。你有 5 张扑克牌&#xff0c;第 i 张牌大小为 ranks[i] &#xff0c;花色为 suits[i] 。 下述是从好到坏你可能持有的 手牌类型 &#xff1a; "Flush"&#xff1a;同花&…...

k8s-二进制部署

文章目录一、环境二、步骤1、安装cfssl工具2、部署etcd集群3、在node节点安装docker组件4、安装flannel组件部署master节点组件部署node节点部署kube-proxy组件三、测试一、环境 角色服务器地址组件master192.168.174.140kube-apiserver&#xff0c;kube-controller-manager&a…...

前缀和差分(C/C++)

目录 1. 前缀和的定义 2. 一维前缀和 2.1 计算公式 2.2 用途 2.3 小试牛刀 3. 二维前缀和 3.1 用途 1. 前缀和的定义 对于一个给定的数列A&#xff0c;他的前缀和数中 S 中 S[ i ] 表示从第一个元素到第 i 个元素的总和。 如下图&#xff1a;绿色区域的和就是前缀和数组…...

回文子串的数量[寻找回文子串的完整思路过程]

寻找回文子串的完整思路过程前言一、回文串的数量二、动态规划1、完整思考过程2、go总结参考文献前言 回文字符串&#xff0c;就是从左遍历和从右遍历的字符是相同顺序的&#xff0c;转换一下&#xff0c;就是该字符串是对称的。寻找回文子串面临两个直接的问题&#xff0c;1-…...

CCNP350-401学习笔记(301-350题)

301、Drag and drop the virtual component from the left onto their descriptions on the right. 302、Which two actions, when applied in the LAN network segment, will facilitate Layer 3 CAPWAP discovery for lightweight AP? (Choose two.)A. Utilize DHCP option …...

【LeetCode】No.225. 用队列实现栈 -- Java Version

题目链接&#xff1a;https://leetcode.cn/problems/implement-stack-using-queues/ 1. 题目介绍&#xff08;225. 用队列实现栈&#xff09; 请你仅使用两个队列实现一个后入先出&#xff08;LIFO&#xff09;的栈&#xff0c;并支持普通栈的全部四种操作&#xff08;push、t…...

45个写规范代码的小技巧

目录 1、规范命名 2、规范代码格式 3、写好代码注释 4、try catch 内部代码抽成一个方法 5、方法别太长 6、抽取重复代码 7、多用return 8、if条件表达式不要太复杂 9、优雅地参数校验 10、统一返回值 11、统一异常处理 12、尽量不传递null值 13、尽量不返回null值…...

MindFusion Diagramming for Java, 最新版 Crack

Diagramming for Java, V4.6.1 A unique Java Swing library for any type of flowchart.您需要的每一个图表功能 图表、方案、图形、网络、算法、树、图表 - 所有这些都是使用 MindFusion Diagramming for Java 工具快速轻松地构建的。结果令人着迷。 Java Dagram 库&#xff…...

中间件安全—Apache常见漏洞

中间件安全—Apache常见漏洞1.Apache常见漏洞1.1.Apache介绍1.2.Apache HTTPD 换行解析漏洞&#xff08;CVE-2017-15715&#xff09;1.2.1.漏洞介绍1.2.2.漏洞环境1.2.2.1.运行漏洞环境1.2.2.2.访问漏洞环境1.2.3.漏洞复现1.2.3.1.拦截1.2.3.2.添加换行1.2.3.3.访问文件1.3.Apa…...

SEO_新手必学的SEO优化基础教程与步骤详解(161 )

SEO优化基础教程&#xff1a;新手如何迈出第一步 在当今互联网时代&#xff0c;搜索引擎优化&#xff08;SEO&#xff09;已经成为了每一个网站拥有高流量、高曝光的关键。SEO不仅仅是一个技术术语&#xff0c;更是一个系统工程&#xff0c;涉及到内容、技术、用户体验等多方面…...

千问3.5-9B镜像+OpenClaw:10分钟搭建云端自动化测试环境

千问3.5-9B镜像OpenClaw&#xff1a;10分钟搭建云端自动化测试环境 1. 为什么选择云端部署OpenClaw 去年我在本地折腾OpenClaw时&#xff0c;光是解决Python环境冲突就花了两天时间。最近发现星图平台提供了千问3.5-9B和OpenClaw的预置镜像组合&#xff0c;实测从创建实例到运…...

OpenClaw安全加固:Qwen3-14B镜像操作权限精细控制方案

OpenClaw安全加固&#xff1a;Qwen3-14B镜像操作权限精细控制方案 1. 为什么需要安全加固&#xff1f; 去年我在尝试用OpenClaw自动整理财务报告时&#xff0c;差点酿成大错——脚本误删了原始Excel文件。这次经历让我意识到&#xff1a;当AI能直接操作系统时&#xff0c;安全…...

vue高频八股

一、基础知识&#xff1a;1.二、指令&#xff1a;概念&#xff1a;带有v-前缀的特殊html属性&#xff0c;用于在模板中表达逻辑&#xff0c;用于将响应式数据绑定到 DOM 元素上或在 DOM 元素上进行一些操作。1.v-if和v-show有什么区别&#xff1a;&#xff08;1&#xff09;v -…...

【树莓派4B】Ubuntu Mate20.04系统配置与ROS Noetic安装全攻略:从烧录到远程桌面控制

1. 树莓派4B与Ubuntu Mate20.04系统烧录 树莓派4B作为一款高性能的单板计算机&#xff0c;在机器人开发和嵌入式项目中广受欢迎。而Ubuntu Mate20.04系统凭借其轻量级和稳定性&#xff0c;成为树莓派上的理想选择。我最近在做一个自主导航项目时&#xff0c;就采用了这个组合方…...

从零到盈利:Unity小游戏如何通过穿山甲广告实现收入最大化

从零到盈利&#xff1a;Unity小游戏如何通过穿山甲广告实现收入最大化 在移动游戏市场&#xff0c;广告变现已成为中小开发者最可靠的收入来源之一。根据行业数据显示&#xff0c;超休闲游戏开发者平均70%的收入来自广告展示&#xff0c;而穿山甲作为国内领先的广告平台&#x…...

从蓝图到代码:UE5项目C++化实战指南

1. 为什么需要将UE5蓝图项目转为C项目 很多刚开始接触Unreal Engine 5的开发者都会从蓝图开始学习。确实&#xff0c;蓝图的可视化编程方式非常直观&#xff0c;不需要写代码就能实现复杂功能。但是随着项目规模扩大&#xff0c;你会发现纯蓝图项目开始暴露出一些明显问题。 首…...

单片机烧录次数解析与存储技术对比

1. 单片机烧录次数的本质解析作为一名嵌入式开发工程师&#xff0c;我经常被初学者问到这个问题&#xff1a;"这块开发板上的单片机到底能反复烧录多少次程序&#xff1f;"要理解这个问题&#xff0c;我们需要从半导体存储器的物理特性说起。单片机程序存储器的烧录寿…...

GrafikLogger:Arduino嵌入式数据可视化轻量日志绘图框架

1. GrafikLogger 库概述&#xff1a;面向嵌入式数据可视化的一体化日志与绘图框架GrafikLogger 是一个专为 Arduino 平台设计的轻量级、协议驱动型数据采集与可视化中间件。它并非传统意义上的纯本地日志库&#xff0c;而是一个端-云协同架构中的关键嵌入式代理组件——其核心价…...

过期域名抢注对SEO优化有什么影响

过期域名抢注对SEO优化有什么影响 在互联网时代&#xff0c;域名作为网站的“地址”在搜索引擎优化&#xff08;SEO&#xff09;中占据重要地位。当一个域名过期且没有被注册&#xff0c;它就成为了一个“空壳”&#xff0c;任何人都可以抢注。过期域名抢注对SEO优化有什么影响…...