注意事项
误用字符串
当需要对一个字符串进行频繁的操作时,谨记在 go 语言中字符串是不可变的(类似 java 和 c#)。使用诸如 a += b
形式连接字符串效率低下,尤其在一个循环内部使用这种形式。这会导致大量的内存开销和拷贝。应该使用一个字符数组代替字符串,将字符串内容写入一个缓存中。 例如以下的代码示例:
1 | var b bytes.Buffer |
注意:由于编译优化和依赖于使用缓存操作的字符串大小,当循环次数大于15时,效率才会更佳。
发生错误时使用defer关闭一个文件
如果你在一个 for 循环内部处理一系列文件,你需要使用 defer 确保文件在处理完毕后被关闭,例如:
1 | for _, file := range files { |
但是在循环结尾处的 defer 没有执行,所以文件一直没有关闭!垃圾回收机制可能会自动关闭文件,但是这会产生一个错误,更好的做法是:
1 | for _, file := range files { |
defer仅在函数返回时才会执行,在循环的结尾或其他一些有限范围的代码内不会执行。
何时使用 new() 和 make()
- 切片、映射和通道,使用 make
- 数组、结构体和所有的值类型,使用 new
不需要将一个指向切片的指针传递给函数
切片实际是一个指向潜在数组的指针。我们常常需要把切片作为一个参数传递给函数是因为:实际就是传递一个指向变量的指针,在函数内可以改变这个变量,而不是传递数据的拷贝。
因此应该这样做:1
func findBiggest( listOfNumbers []int ) int {}
而不是:1
func findBiggest( listOfNumbers *[]int ) int {}
当切片作为参数传递时,切记不要解引用切片。
使用指针指向接口类型
查看如下程序:nexter
是一个接口类型,并且定义了一个next()
方法读取下一字节。函数 nextFew
将 nexter
接口作为参数并读取接下来的 num 个字节,并返回一个切片:这是正确做法。但是 nextFew2
使用一个指向 nexter 接口类型的指针作为参数传递给函数:当使用 next()
函数时,系统会给出一个编译错误:*n.next undefined (type nexter has no
field or method next)*
1 | package main |
永远不要使用一个指针指向一个接口类型,因为它已经是一个指针。
使用值类型时误用指针
将一个值类型作为一个参数传递给函数或者作为一个方法的接收者,似乎是对内存的滥用,因为值类型一直是传递拷贝。但是另一方面,值类型的内存是在栈上分配,内存分配快速且开销不大。如果你传递一个指针,而不是一个值类型,go编译器大多数情况下会认为需要创建一个对象,并将对象移动到堆上,所以会导致额外的内存分配:因此当使用指针代替值类型作为参数传递时,我们没有任何收获。
闭包和协程的使用
1 | package main |
输出:1
2
3
4
5
6
70 1 2 3 4
4 4 4 4 4
1 0 3 4 2
10 11 12 13 14
版本 A 调用闭包 5 次打印每个索引值,版本 B 也做相同的事,但是通过协程调用每个闭包。按理说这将执行得更快,因为闭包是并发执行的。如果我们阻塞足够多的时间,让所有协程执行完毕,版本 B 的输出是:4 4 4 4 4
。为什么会这样?在版本 B 的循环中,ix 变量实际是一个单变量,表示每个数组元素的索引值。因为这些闭包都只绑定到一个变量,这是一个比较好的方式,当你运行这段代码时,你将看见每次循环都打印最后一个索引值 4,而不是每个元素的索引值。因为协程可能在循环结束后还没有开始执行,而此时 ix值是 4。
版本 C 的循环写法才是正确的:调用每个闭包是将 ix 作为参数传递给闭包。ix 在每次循环时都被重新赋值,并将每个协程的 ix 放置在栈中,所以当协程最终被执行时,每个索引值对协程都是可用的。注意这里的输出可能是 0 2 1 3 4
或者 0 3 1 2 4
或者其他类似的序列,这主要取决于每个协程何时开始被执行。
在版本 D 中,我们输出这个数组的值,为什么版本 B 不能而版本 D 可以呢?
因为版本 D 中的变量声明是在循环体内部,所以在每次循环时,这些变量相互之间是不共享的,所以这些变量可以单独的被每个闭包使用。
实用代码片段
字符串
(1)如何修改字符串中的一个字符:
1 | str:="hello" |
(2)如何获取字符串的子串:
1 | substr := str[n:m] |
(3)如何使用for
或者for-range
遍历一个字符串:
1 | // gives only the bytes: |
(4)如何获取一个字符串的字节数:len(str)
如何获取一个字符串的字符数:
最快速:utf8.RuneCountInString(str)
len([]int(str))
(5)如何连接字符串:
最快速:with a bytes.Buffer
Strings.Join()
使用+=
:
1 | str1 := "Hello " |
(6)如何解析命令行参数:使用 os
或者flag
包
数组和切片
创建:1
2
3arr1 := new([len]type)
slice1 := make([]type, len)
初始化:1
2
3
4
5arr1 := [...]type{i1, i2, i3, i4, i5}
arrKeyValue := [len]type{i1: val1, i2: val2}
var slice1 []type = arr1[start:end]
(1)如何截断数组或者切片的最后一个元素:1
line = line[:len(line)-1]
(2)如何使用 for
或者 for-range
遍历一个数组(或者切片):
1 | for i:=0; i < len(arr); i++ { |
(3)如何在一个二维数组或者切片 arr2Dim 中查找一个指定值 V:1
2
3
4
5
6
7
8
9found := false
Found: for row := range arr2Dim {
for column := range arr2Dim[row] {
if arr2Dim[row][column] == V{
found = true
break Found
}
}
}
映射
创建: map1 := make(map[keytype]valuetype)
初始化:map1 := map[string]int{"one": 1, "two": 2}
(1)如何使用 for
或者for-range
遍历一个映射:1
2
3for key, value := range map1 {
…
}
(2)如何在一个映射中检测键 key1 是否存在:1
val1, isPresent = map1[key1]
返回值:键 key1
对应的值或者 0, true 或者 false
(3)如何在映射中删除一个键:1
delete(map1, key1)
结构体
创建:1
2
3
4
5
6type struct1 struct {
field1 type1
field2 type2
…
}
ms := new(struct1)
初始化:1
ms := &struct1{10, 15.5, "Chris"}
当结构体的命名以大写字母开头时,该结构体在包外可见。
通常情况下,为每个结构体定义一个构建函数,并推荐使用构建函数初始化结构体
1 | ms := Newstruct1{10, 15.5, "Chris"} |
接口
(1)如何检测一个值 v
是否实现了接口 Stringer
:
1 | if v, ok := v.(Stringer); ok { |
(2)如何使用接口实现一个类型分类函数:
1 | func classifier(items ...interface{}) { |
函数
如何使用内建函数 recover
终止 panic
过程
1 | func protect(g func()) { |
文件
(1)如何打开一个文件并读取:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16file, err := os.Open("input.dat")
if err != nil {
fmt.Printf("An error occurred on opening the inputfile\n" +
"Does the file exist?\n" +
"Have you got acces to it?\n")
return
}
defer file.Close()
iReader := bufio.NewReader(file)
for {
str, err := iReader.ReadString('\n')
if err != nil {
return // error or EOF
}
fmt.Printf("The input was: %s", str)
}
(2)如何通过切片读写文件:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19func cat(f *file.File) {
const NBUF = 512
var buf [NBUF]byte
for {
switch nr, er := f.Read(buf[:]); true {
case nr < 0:
fmt.Fprintf(os.Stderr, "cat: error reading from %s: %s\n",
f.String(), er.String())
os.Exit(1)
case nr == 0: // EOF
return
case nr > 0:
if nw, ew := file.Stdout.Write(buf[0:nr]); nw != nr {
fmt.Fprintf(os.Stderr, "cat: error writing from %s: %s\n",
f.String(), ew.String())
}
}
}
}
协程(goroutine)与通道(channel)
出于性能考虑的建议:
实践经验表明,如果你使用并行运算获得高于串行运算的效率:在协程内部已经完成的大部分工作,其开销比创建协程和协程间通信还高。
1 出于性能考虑建议使用带缓存的通道:
使用带缓存的通道可以很轻易成倍提高它的吞吐量,某些场景其性能可以提高至10倍甚至更多。通过调整通道的容量,甚至可以尝试着更进一步的优化其性能。
2 限制一个通道的数据数量并将它们封装成一个数组:
如果使用通道传递大量单独的数据,那么通道将变成性能瓶颈。然而,将数据块打包封装成数组,在接收端解压数据时,性能可以提高至 10 倍。
创建:ch := make(chan type,buf)
(1)如何使用 for
或者 for-range
遍历一个通道:
1 | for v := range ch { |
(2)如何检测一个通道 ch 是否关闭:1
2
3
4
5
6
7
8 // read channel until it closes or error-condition
for {
if input, open := <-ch; !open {
break
}
fmt.Printf("%s", input)
}
或者使用(1)自动检测。
(3)如何通过一个通道让主程序等待直到协程完成:
(信号量模式):
1 | ch := make(chan int) // Allocate a channel. |
如果希望程序一直阻塞,在匿名函数中省略 ch <- 1
即可。
(4)通道的工厂模板:以下函数是一个通道工厂,启动一个匿名函数作为协程以生产通道:
1 | func pump() chan int { |
如何在程序出错时终止程序
1 | if err != nil { |
或者:1
2
3if err != nil {
panic(“ERROR occurred: “ + err.Error())
}
出于性能考虑的最佳实践和建议
(1)尽可能的使用 :=
去初始化声明一个变量(在函数内部);
(2)尽可能的使用字符代替字符串;
(3)尽可能的使用切片代替数组;
(4)尽可能的使用数组和切片代替映射 ;
(5)如果只想获取切片中某项值,不需要值的索引,尽可能的使用 for range 去遍历切片,这比必须查询切片中的每个元素要快一些;
(6)当数组元素是稀疏的(例如有很多 0 值或者空值 nil),使用映射会降低内存消耗;
(7)初始化映射时指定其容量;
(8)当定义一个方法时,使用指针类型作为方法的接受者;
(9)在代码中使用常量或者标志提取常量的值;
(10)尽可能在需要分配大量内存时使用缓存;
(11)使用缓存模板