golang技术随笔(二)理解goroutine
进程、线程和协程要理解什么是goroutine,我们先来看看进程、线程以及协程它们之间的区别,这能帮助我们更好的理解goroutine。 进程:分配完整独立的地址空间,拥有自己独立的堆和栈,既不共享堆,亦不共享栈,进程的切换只发生在内核态,由操作系统调度。 进程和线程的切换主要依赖于时间片的控制(关于进程和线程的调度方式,具体可参看这篇文章:http://blog.chinaunix.net/uid-20476365-id-1942505.html),而协程的切换则主要依赖于自身,这样的好处是避免了无意义的调度,由此可以提高性能,但也因此,程序员必须自己承担调度的责任。 goroutine可以看作是协程的go语言实现,从百度百科上看协程的定义:与子例程一样,协程(coroutine)也是一种程序组件。相对子例程而言,协程更为一般和灵活,但在实践中使用没有子例程那样广泛。实际上,我们可以把子例程当作是协程的一种特例。一般来说,如果没有显式的让出CPU,就会一直执行当前协程。 浅析goroutine我们知道goroutine是协程的go语言实现,它是语言原生支持的,相对于一般由库实现协程的方式,goroutine更加强大,它的调度一定程度上是由go运行时(runtime)管理。其好处之一是,当某goroutine发生阻塞时(例如同步IO操作等),会自动出让CPU给其它goroutine。 goroutine的使用非常简单,例如foo是一个函数: go foo()
就一个关键字go搞定了,这里会启动一个goroutine执行foo函数,然后CPU继续执行后面的代码。这里虽然启动了goroutine,但并不意味着它会得到马上调度,关于goroutine的调度我们稍后再探讨。 goroutine是非常轻量级的,它就是一段代码,一个函数入口,以及在堆上为其分配的一个堆栈(初始大小为4K,会随着程序的执行自动增长删除)。所以它非常廉价,我们可以很轻松的创建上万个goroutine。 go运行时调度默认的,所有goroutine会在一个原生线程里跑,也就是只使用了一个CPU核。在同一个原生线程里,如果当前goroutine不发生阻塞,它是不会让出CPU时间给其他同线程的goroutines的。除了被系统调用阻塞的线程外,Go运行库最多会启动$GOMAXPROCS个线程来运行goroutine。 那么goroutine究竟是如何被调度的呢?我们从go程序启动开始说起。在go程序启动时会首先创建一个特殊的内核线程sysmon,从名字就可以看出来它的职责是负责监控的,goroutine背后的调度可以说就是靠它来搞定。 接下来,我们再看看它的调度模型,go语言当前的实现是N:M。即一定数量的用户线程映射到一定数量的OS线程上,这里的用户线程在go中指的就是goroutine。go语言的调度模型需要弄清楚三个概念:M、P和G,如下图表示: 那么go中切换goroutine的调度点有哪些呢?具体有以下三种情况
调度点的情况说清楚了,但整个模型还并不完整。我们知道当使用go去调用一个函数,会生成一个新的goroutine放入当前P的队列中,那么什么时候生成别的OS线程,各个OS线程又是如何做负载均衡的呢? 当M从队列中拿到一个可执行的G后,首先会去检查一下,自己的队列中是否还有等待的G,如果还有等待的G,并且也还有空闲的P,此时就会通知runtime分配一个新的M(如果有在睡觉的OS线程,则直接唤醒它,没有的话则生成一个新的OS线程)来分担任务。 如果某个M发现队列为空之后,会首先从全局队列中取一个G来处理。如果全局队列也空了,则会随机从别的P那里直接截取一半的队列过来(偷窃任务),如果发现所有的P都没有可供偷窃的G了,该M就会陷入沉睡。 整个调度模型大致就是这样子了,和所有协程的调度一样,在响应时间上,这种协作式调度是硬伤。很容易导致某个协程长时间无法得到执行。但总体来说,它带来的好处更加让人惊叹。想要了解的更多可以看看我下面列出的一些参考资料,或是直接看它的源码:http://golang.org/src/runtime/proc.c 总纲传送门:golang技术随笔总纲 参考资料
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |