当我们想要在 Go 语言中初始化一个结构时,可能会用到两个不同的关键字 — make
和 new
。因为它们的功能相似,所以初学者可能会对这两个关键字的作用感到困惑1,但是它们两者能够初始化的却有较大的不同。
我们在代码中往往都会使用如下所示的语句初始化这三类基本类型,这三个语句分别返回了不同类型的数据结构:
1 | slice := make([]int, 0, 100) |
slice
是一个包含data
、cap
和len
的私有结构体internal/reflectlite.sliceHeader
;hash
是一个指向runtime.hmap
结构体的指针;ch
是一个指向runtime.hchan
结构体的指针;
相比与复杂的 make
关键字,new
的功能就很简单了,它只能接收一个类型作为参数然后返回一个指向该类型的指针:
1 | i := new(int) |
上述代码片段中的两种不同初始化方法是等价的,它们都会创建一个指向 int
零值的指针。
接下来我们将分别介绍 make
和 new
在初始化不同数据结构时的过程,我们会从编译期间和运行时两个不同阶段理解这两个关键字的原理,不过由于前面的章节已经详细地分析过 make
的原理,所以这里会将重点放在另一个关键字 new
上。
make
在前面的章节中我们已经谈到过 make
在创建切片、哈希表和 Channel 的具体过程,所以在这一小节,我们只是会简单提及 make
相关的数据结构的初始化原理。
在编译期间的类型检查阶段,Go 语言就将代表 make
关键字的 OMAKE
节点根据参数类型的不同转换成了 OMAKESLICE
、OMAKEMAP
和 OMAKECHAN
三种不同类型的节点,这些节点会调用不同的运行时函数来初始化相应的数据结构。
new
编译器会在中间代码生成阶段通过以下两个函数处理该关键字:
cmd/compile/internal/gc.callnew
函数会将关键字转换成ONEWOBJ
类型的节点2;cmd/compile/internal/gc.state.expr
函数会根据申请空间的大小分两种情况处理:
- 如果申请的空间为 0,就会返回一个表示空指针的
zerobase
变量; - 在遇到其他情况时会将关键字转换成
runtime.newobject
函数:
1 | func callnew(t *types.Type) *Node { |
需要注意的是,无论是直接使用 new
,还是使用 var
初始化变量,它们在编译器看来就是 ONEWOBJ
和 ODCL
节点。这些节点在这一阶段都会被 cmd/compile/internal/gc.walkstmt
转换成通过 runtime.newobject
函数在堆上申请内存:
1 | func walkstmt(n *Node) *Node { |
不过这也不是绝对的,如果通过 var
或者 new
创建的变量不需要在当前作用域外生存,例如不用作为返回值返回给调用方,那么就不需要初始化在堆上。
runtime.newobject
函数会是获取传入类型占用空间的大小,调用 runtime.mallocgc
在堆上申请一片内存空间并返回指向这片内存空间的指针:
1 | func newobject(typ *_type) unsafe.Pointer { |
runtime.mallocgc
函数的实现大概有 200 多行代码,我们会在后面的章节中详细分析 Go 语言的内存管理机制。
小结
到了最后,简单总结一下 Go 语言中 make
和 new
关键字的实现原理,make
关键字的作用是创建切片、哈希表和 Channel 等内置的数据结构,而 new
的作用是为类型申请一片内存空间,并返回指向这片内存的指针。