Go字符串拼接的方式与性能对比
一、Go中字符串的特殊之处
Go中的字符串是 UTF-8 字符的一个序列(当字符为 ASCII 码时则占用 1 个字节,其它字符根据需要占用 2-4 个字节)。由于该编码对占用字节长度的不定性,Go 中的字符串里面的字符也可能根据需要占用 1 至 4 个字节,这与其它语言如 C++、Java 或者 Python 不同(Java 始终使用 2 个字节)。Go 这样做的好处是不仅减少了内存和硬盘空间占用,同时也不用其它语言那样需要对使用 UTF-8 字符集的文本进行编码和解码。
字符串是一种值类型,且值不可变,即创建某个文本后你无法再次修改这个文本的内容;更深入地讲,字符串是字节的定长数组。
//go字符串底层数据结构
type StringHeader struct {Data uintptr //字符串指向的底层字节数组Len int //字符串的字节的长度
}
和 C/C++不一样,Go 中的字符串是根据长度限定,而非特殊字符\0
。string
类型的零值为长度为零的字符串,即空字符串 ""
。
一般的比较运算符(==
、!=
、<
、<=
、>=
、>
)通过在内存中按字节比较来实现字符串的对比。你可以通过函数 len()
来获取字符串所占的字节长度,例如:len(str)
。
二、字符串拼接的五种方式
1、字符串拼接符 +
两个字符串 s1
和 s2
可以通过 s := s1 + s2
拼接在一起。
s2
追加在 s1
尾部并生成一个新的字符串 s
。
可以通过以下方式来对代码中多行的字符串进行拼接:
str := "Beginning of the string " +"second part of the string"
由于编译器行尾自动补全分号的缘故,加号 +
必须放在第一行。
拼接的简写形式 +=
也可以用于字符串:
s := "hel" + "lo,"
s += "world!"
fmt.Println(s) //输出 “hello, world!”
但是,在循环中使用加号 +
拼接字符串并不是最高效的做法,更好的办法是使用函数 strings.Join()
。
2、使用strings.Join()
函数
go的strings
包为字符串的拼接提供了一个方法
func Join(a []string, sep string) string
Join
用于将元素类型为string
的切片使用分割符号sep
来拼接组成一个字符串。
例如:
func main() {s1 := "hello,"s2 := "world!"join := strings.Join([]string{s1, s2}, "")fmt.Println(join) //打印 hello,world!
}
3、使用fmt.Sprintf()
函数
Sprintf()
函数可以将格式化后的字符串以返回值的形式返回。
func main() {s1 := "hello,"s2 := "world!"sprintf := fmt.Sprintf("%s%s", s1, s2)fmt.Println(sprintf) //打印hello,world!
}
内部使用[]byte
实现,不像直接运算符这种会产生很多临时的字符串,但是内部的逻辑比较复杂,有很多额外的判断,还用到了interface
,所以性能也不是很好。
4、使用buffer.WriteString()
方法
bytes
包中的Buffer
类(类似于Java
的StringBuilder
类)提供了一个方法:
func (b *Buffer) WriteString(s string) (n int, err error)
在下面的代码段中,我们创建一个 buffer,通过 buffer.WriteString(s)
方法将字符串 s 追加到后面,最后再通过 buffer.String()
方法转换为string
:
func main() {s1 := "hello,"s2 := "world!"var buf bytes.Bufferbuf.WriteString(s1)buf.WriteString(s2)fmt.Println(buf.String()) //输出hello,world!
}
这种实现方式比使用 +=
要更节省内存和 CPU,尤其是要串联的字符串数目特别多的时候。如果能预估字符串的长度,还可以用buffer.Grow()
方法来设置 cap。
5、使用Builder.WriterString()
方法
与bytes
类似,strings
包中存在的Builder
类提供一个方法:
func (b *Builder) WriteString(s string) (int, error)
下列代码,使用Builder.WriterString()
方法拼接字符串。
func main() {var buf strings.Builderbuf.WriteString("hello,")buf.WriteString("world")fmt.Println(buf.String()) //输出hello,world
}
strings.Builder
同样也提供了Grow()
来支持预定义容量。strings.Builder
内部通过切片来保存和管理内容。当我们可以预定义我们需要使用的容量时,strings.Builder
就能避免扩容而创建新的切片了。strings.Builder
是非线程安全,性能上和bytes.Buffer
不分上下。
三、性能对比
测试代码:
func JoinString() {var loop = 300000var s stringaim := "w"var start time.Time//拼接符+连接==================================s = ""start = time.Now()for i := 0; i < loop; i++ {s += aim}fmt.Printf("len(s):%d,拼接符方法:%v\n", len(s), time.Since(start))//strings.Join连接==================================s = ""start = time.Now()v := []string{s, aim}for i := 0; i < loop; i++ {s = strings.Join(v, "")}fmt.Printf("len(s):%d,strings.Join方法:%v\n", len(s), time.Since(start))//buffer.WriterString方法==================================s = ""start = time.Now()var buf bytes.Bufferfor i := 0; i < loop; i++ {buf.WriteString(aim)}s = buf.String()fmt.Printf("len(s):%d,buffer.WriterString方法:%v\n", len(s), time.Since(start))//Builder.WriterString方法==================================s = ""start = time.Now()var builder strings.Builderfor i := 0; i < loop; i++ {builder.WriteString(aim)}s = builder.String()fmt.Printf("len(s):%d,Builder.WriterString方法:%v\n", len(s), time.Since(start))//fmt.Sprintf方法==================================s = ""start = time.Now()for i := 0; i < loop; i++ {s = fmt.Sprintf("%s%s", s, aim)}fmt.Printf("len(s):%d,fmt.Sprintf方法:%v\n", len(s), time.Since(start))
}
结果:
len(s):300000---------拼接符方法-----------------------------3.7244467s
len(s):1------------------strings.Join方法----------------------6.9228ms
len(s):300000---------buffer.WriterString方法--------------1.5602ms
len(s):300000---------Builder.WriterString方法------------528.9µs
len(s):300000---------fmt.Sprintf方法------------------------7.7673889s
初步分析得出(“>”
表示优于):
Builder.WriterString
>buffer.WriterString
>strings.Join
>拼接符方法
>fmt.Sprintf
当然,具体性能要根据实际使用情况而定。
四、使用建议
使用建议引用自其他博客
- 在已有字符串数组的场合,使用
strings.Join()
能有比较好的性能 - 在一些性能要求较高的场合,尽量使用
buffer.WriteString()
或Builder.WriterString()
以获得更好的性能 - 性能要求不太高的场合,直接使用运算符,代码更简短清晰,能获得比较好的可读性
- 如果需要拼接的不仅仅是字符串,还有数字之类的其他需求的话,可以考虑
fmt.Sprintf()
参考博客:
https://www.jianshu.com/p/df92c0ee6cc8
https://www.cnblogs.com/vinsent/p/11281777.html
Go字符串拼接的方式与性能对比相关推荐
- Go语言6种字符串拼接的方式
Go语言6种字符串拼接的方式 前言 string类型 字符串拼接的6种方式及原理 原生拼接方式"+" 字符串格式化函数fmt.Sprintf Strings.builder byt ...
- 详解C#实例化对象的三种方式及性能对比
前言 做项目过程中有个需求要实例化两万个对象并添加到List 中,这个过程大概需要1min才能加载完(传参较多),于是开启了代码优化之旅,再此记录. 首先想到的是可能实例化比较耗时,于是开始对每种实例 ...
- SQLServer中批量插入数据方式的性能对比 (转)
转自:http://www.cnblogs.com/wlb/archive/2010/03/02/1676136.html 昨天下午快下班的时候,无意中听到公司两位同事在探讨批量向数据库插入数据的性能 ...
- SQLServer中批量插入数据方式的性能对比
昨天下午快下班的时候,无意中听到公司两位同事在探讨批量向数据库插入数据的性能优化问题,顿时来了兴趣,把自己的想法向两位同事说了一下,于是有了本文. 公司技术背景:数据库访问类(xxx.DataBase ...
- 深度拷贝 java_Java深度拷贝方式和性能对比
前言 Java的深度拷贝大致分为克隆(实现Java的Clone接口)和序列化(实现Java的Serializable接口)两种,但是基于不同的序列化方式,有可以延伸出几种方式.下面分析一下每种的注意事 ...
- Java集合篇:Map常用遍历方式 以及 性能对比
一.Map集合常用的遍历方式: 遍历Map集合的常用方式有三种:使用keySet的方式,使用entrySet的方式,使用values()取值的方式,这三种方式中,都有对应的for循环遍历和Iterat ...
- 求斐波那契数列第n位的几种实现方式及性能对比
在每一种编程语言里,斐波那契数列的计算方式都是一个经典的话题.它可能有很多种计算方式,例如:递归.迭代.数学公式.哪种算法最容易理解,哪种算法是性能最好的呢? 这里给大家分享一下我对它的研究和总结:下 ...
- 求斐波那契数列第n位的几种实现方式及性能对比(c#语言)
在每一种编程语言里,斐波那契数列的计算方式都是一个经典的话题.它可能有很多种计算方式,例如:递归.迭代.数学公式.哪种算法最容易理解,哪种算法是性能最好的呢? 这里给大家分享一下我对它的研究和总结:下 ...
- canvas 擦除动画_帧动画的多种实现方式与性能对比
作者: 前端向朔 from 迅雷前端 本文目录 Web 动画形式 应用场景 素材准备 实现方案 一.GIF 图 二.CSS3 帧动画 三.JS 帧动画 方案总结 注意事项 总结 Web 动画形式 首先 ...
最新文章
- java 字符串原子变量,如何在java中提供原子读/写2个变量?
- redis 槽点重新分配 集群_5000+字硬核干货!Redis 分布式集群部署实战
- report things that go wrong
- 研发协同平台持续集成Jenkins作业设计演进
- STL map常用操作简介
- 1.C和C++区别,以及const分析(底层const/顶层const)
- python cv2.resize_Python OpenCV 图像缩放 cv2.resize 方法
- jvm内存模型_JVM|02内存模型
- 通过mysqlslap与sysbench对MySQL进行压测
- 机器学习知识点查漏补缺(朴素贝叶斯分类)
- 常规网站模板(flash作div背景)
- linux 内核学习
- python整行列匹配,python-熊猫将行与列值匹配
- 阿西莫夫定律:自动驾驶汽车算不算机器人?该不该伤人?
- 独立站运营 | FaceBook营销神器——聊天机器人ManyChat
- WIN间远程桌面连接:你的凭据不工作解决(亲测有效)
- plotly绘制简单图形10--金字塔图
- 使用python爬虫爬取百度新闻,告诉你社会热点话题
- 万字报告!一文看懂全球车厂的技术家底模块化平台
- 如何在项目管理中定义可交付成果?