死锁
本节介绍死锁的概念和如何避免死锁。
什么是死锁
所谓死锁,是指多个线程循环等待它方占有的资源而无限期地僵持下去的局面。很显然,如果没有外力的作用,那么死锁涉及到的各个线程都将永远处于阻塞状态。
就如同两个人过独木桥,如果两个人都要先过,在独木桥上僵持不肯后退,必然会因竞争资源产生死锁;但是,如果两个人上桥前先看一看对面有无人在桥上,当对面无人在桥上时自己才上桥,那么问题就解决了。
死锁的产生条件
如果在计算机系统中 同时 具备下面四个必要条件,那么将会发生死锁。换句话说,只要下面四个条件有一个不具备,那么系统就不会发生死锁。
互斥条件
即某个资源在一段时间内只能由一个线程占有,不能同时被两个或两个以上的线程占有。这种独占资源如 CD-ROM 驱动器、打印机等等,必须在占有该资源的线程主动释放它之后,其他线程才能占有该资源。这是由资源本身的属性所决定的。如独木桥就是一种独占资源,两面的人不能同时过桥。
不可抢占条件
线程所获得的资源在未使用完毕之前,资源申请者不能强行地从资源占有者手中夺取资源,而只能由该资源的占有者线程自行释放。如过独木桥的人不能强迫对方后退,也不能非法地将对方推下桥,必须是桥上的人自己过桥后空出桥面(即主动释放占有资源),对面的人才能过桥。
占有且申请条件
线程至少已经占有一个资源,但又申请新的资源;由于该资源已被另外线程占有,此时该线程阻塞;但是,它在等待新资源之时,仍继续占用已占有的资源。还以过独木桥为例,甲乙两人在桥上相遇。甲走过一段桥面(即占有了一些资源),还需要走其余的桥面(申请新的资源),但那部分桥面已经被乙占有(乙走过一段桥面)。甲不能前进,又不后退;乙也处于同样的状况。
循环等待条件
存在一个线程等待序列 {P1,P2,...,Pn},其中 P1 等待 P2 所占有的某一资源,P2 等待 P3 所占有的某一资源,……,而 Pn 等待 P1 所占有的的某一资源,形成一个线程循环等待环。就像前面的过独木桥问题,甲等待乙占有的桥面,而乙又等待甲占有的桥面,从而彼此循环等待。
上面我们提到的这四个条件在死锁时会同时发生。也就是说,只要有一个必要条件不满足,则死锁就不会发生。
死锁的预防
前面介绍了死锁发生时的四个必要条件,只要破坏这四个必要条件中的任意一个条件,死锁就不会发生。这就为我们解决死锁问题提供了可能。一般地,解决死锁的方法分为死锁的预防、避免、检测与恢复三种(注意:死锁的检测与恢复是一个方法)。
死锁的预防是保证系统不进入死锁状态的一种策略。它的基本思想是要求线程申请资源时遵循某种协议,从而打破产生死锁的四个必要条件中的一个或几个,保证系统不会进入死锁状态。
打破互斥条件
即允许线程同时访问某些资源。但是,有的资源是不允许被同时访问的,像打印机等,这是由资源本身的属性所决定的。所以,这种办法并无实用价值。
打破不可抢占条件
即允许线程强行从占有者那里夺取某些资源。就是说,当一个线程已占有了某些资源,它又申请新的资源,但不能立即被满足时,它必须释放所占有的全部资源,以后再重新申请。它所释放的资源可以分配给其他线程。这就相当于该线程占有的资源被隐蔽地抢占了。这种预防死锁的方法实现起来困难,会降低系统性能。
打破占有且申请条件
可以实行资源预先分配策略。即线程在运行前一次性地向系统申请它所需要的全部资源。如果某个线程所需的全部资源得不到满足,则不分配任何资源,此线程暂不运行。只有当系统能够满足当前线程的全部资源需求时,才一次性地将所申请的资源全部分配给该线程。由于运行的线程已占有了它所需的全部资源,所以不会发生占有资源又申请资源的现象,因此不会发生死锁。但是,这种策略也有以下缺点:
- 在许多情况下,一个线程在执行之前不可能知道它所需要的全部资源。这是由于线程在执行时是动态的,不可预测的。
- 资源利用率低。无论所分资源何时用到,一个线程只有在占有所需的全部资源后才能执行。即使有些资源最后才被该线程用到一次,但该线程在生存期间却一直占有它们,造成长期占着不用的状况。这显然是一种极大的资源浪费。
- 降低线程的并发性。因为资源有限,又加上存在浪费,能分配到所需全部资源的线程个数就必然少了。
打破循环等待条件
实行资源有序分配策略。采用这种策略,即把资源事先分类编号,按号分配,使线程在申请、占用资源时不会形成环路。所有线程对资源的请求必须严格按资源序号递增的顺序提出。线程占用了小号资源,才能申请大号资源,就不会产生环路,从而预防了死锁。这种策略与前面的策略相比,资源的利用率和系统吞吐量都有很大提高,但是也存在以下缺点:
- 限制了线程对资源的请求,同时对系统中所有资源进行合理编号增加了困难,并增加了系统开销。
- 为了遵循按编号申请的次序,暂不使用的资源也需要提前申请,从而增加了线程对资源的占用时间。
SylixOS 不支持死锁的避免、检测与恢复,所以死锁只能预防,一般情况下我们使用打破循环等待条件来预防死锁,同时使用超时等待可以化解死锁,但要求应用程序有完善的超时出错处理机制。
注意:
庆幸的是,SylixOS 提供了命令“tp”用来查看哪些线程可能发生了死锁。