线程是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中的实际运作单位。
如果对进程、线程概念还不是很了解,建议看下CPU、超线程与进程、线程。
Python的标准库提供了两个模块:thread
和threading
,前者是低级模块,后者是高级模块。threading
对thread
进行了封装,绝大多数情况下,我们只需要使用threading
就可以了,这也是Python官方推荐。
Python 3中,thread已经更名成_thread。
thread
总结几点:
- 调用
start_new_thread
方法即启动线程,启动后MainThread
必须等待,否则启动的子线程旋即退出。 thread.exit()
和thread.interrupt_main()
都是通过raise异常实现的。lock.acquire([waitflag])
方法,当waitflag
等于0时,表示非阻塞获取锁,即获取失败也立即返回。所以下面的demo中,worker
方法中的lock.acquire(0)
改为lock.acquire(1)
时,运行时间将比现在多10s。- 锁的
release
与acquire
可以不是同一个线程。 - Py3获取锁的方法
lock.acquire
新增了timeout
参数,并且设置的值不能大于TIMEOUT_MAX
。
以下demo在Python2.7和Python3.5测试通过。
1 | # coding=utf-8 |
threading
1 | # coding=utf-8 |
GIL
既然用到Python的多线程,必须得知道GIL
的存在。
GIL(Global Interpreter Lock)
启动与CPU核心数量相同的N个线程,在4核CPU上可以监控到CPU占用率仅有160%,也就是使用不到两核。
即使启动100个线程,使用率也就170%左右,仍然不到两核。
但是用C、C++或Java来改写相同的死循环,直接可以把全部核心跑满,4核就跑到400%,8核就跑到800%,为什么Python不行呢?
因为Python的线程虽然是真正的线程,但解释器执行代码时,有一个GIL锁:Global Interpreter Lock,任何Python线程执行前,必须先获得GIL锁,然后,每执行100条字节码,解释器就自动释放GIL锁,让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁,所以,多线程在Python中只能交替执行,即使100个线程跑在100核CPU上,也只能用到1个核。
GIL是Python解释器设计的历史遗留问题,通常我们用的解释器是官方实现的CPython,要真正利用多核,除非重写一个不带GIL的解释器。
所以,在Python中,可以使用多线程,但不要指望能有效利用多核。如果一定要通过多线程利用多核,那只能通过C扩展来实现,不过这样就失去了Python简单易用的特点。
不过,也不用过于担心,Python虽然不能利用多线程实现多核任务,但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁,互不影响。
参考资料:
Python 2 thread 官方文档
Python 3 _thread 官方文档
Python 3 _thread 中文译文
Pythoh 2 threading 官方文档
Pythoh 3 threading 官方文档
Pythoh 3 threading 中文译文
Python 3 cookbook 并发编程
深入 GIL: 如何寫出快速且 thread-safe 的 Python – Grok the GIL: How to write fast and thread-safe Python
多线程
Python多线程之threading Event
【Python】threading.Event模块控制多线程
Launching parallel tasks
python多线程间通信机制-event