虽然在多数情况下, $task 消除了同步操作的要求,但是不是所有的多线程系统都用任务来实现。所以,还需要改进现有的线程模块。 synchronized 关键字有下列缺点:
无法指定一个超时值。
无法中断一个正在等待请求锁的线程。
无法安全地请求多个锁 。(多个锁只能以依次序获得。)
解决这些问题的办法是:扩展 synchronized 的语法,使它支持多个参数和能接受一个超时说明(在下面的括弧中指定)。下面是我希望的语法:
synchronized(x && y && z) | 获得 x 、 y 和 z 对象的锁。 |
synchronized(x || y || z) | 获得 x 、 y 或 z 对象的锁。 |
synchronized( (x && y ) || z) | 对于前面代码的一些扩展。 |
synchronized(...)[1000] | 设置 1 秒超时以获得一个锁。 |
synchronized[1000] f(){...} | 在进入 f() 函数时获得 this 的锁,但可有 1 秒超时。 |
超时是需要的,但还不足以使代码强壮。您还需要具备从外部中止请求锁等待的能力。所以,当向一个等待锁的线程传送一个 interrupt() 方法后,此方法应抛出一个 SynchronizationException 对象,并中断等待的线程。这个异常应是 RuntimeException 的一个派生类,这样不必特别处理它。
对 synchronized 语法这些推荐的更改方法的主要问题是,它们需要在二进制代码级上修改。而目前这些代码使用进入监控(enter-monitor)和退出监控(exit-monitor)指令来实现 synchronized 。而这些指令没有参数,所以需要扩展二进制代码的定义以支持多个锁定请求。但是这种修改不会比在 Java 2 中修改 Java 虚拟机的更轻松,但它是向下兼容现存的 Java 代码。
另一个可解决的问题是最常见的死锁情况,在这种情况下,两个线程都在等待对方完成某个操作。设想下面的一个例子(假设的):
2 { Object lock1 = new Object();
3 Object lock2 = new Object();
4 void a()
5 { synchronized( lock1 )
6 { synchronized( lock2 )
7 { // do something
8 }
9 }
10 }
11 void b()
12 { synchronized( lock2 )
13 { synchronized( lock1 )
14 { // do something
15 }
16 }
17 }
18
设想一个线程调用 a() ,但在获得 lock1 之后在获得 lock2 之前被剥夺运行权。 第二个线程进入运行,调用 b() ,获得了 lock2 ,但是由于第一个线程占用 lock1 ,所以它无法获得 lock1 ,所以它随后处于等待状态。此时第一个线程被唤醒,它试图获得 lock2 ,但是由于被第二个线程占据,所以无法获得。此时出现死锁。下面的 synchronize-on-multiple-objects 的语法可解决这个问题:
2 void a()
3 { synchronized( lock1 && lock2 )
4 {
5 }
6 }
7 void b()
8 { synchronized( lock2 && lock3 )
9 {
10 }
11 }
12
编译器(或虚拟机)会重新排列请求锁的顺序,使 lock1 总是被首先获得,这就消除了死锁。
但是,这种方法对多线程不一定总成功,所以得提供一些方法来自动打破死锁。一个简单的办法就是在等待第二个锁时常释放已获得的锁。这就是说,应采取如下的等待方式,而不是永远等待:
2 { try
3 { synchronized( some_lock )[10]
4 { // do the work here.
5 break;
6 }
7 }
8 catch( TimeoutException e )
9 { continue;
10 }
11 }
12
如果等待锁的每个程序使用不同的超时值,就可打破死锁而其中一个线程就可运行。我建议用以下的语法来取代前面的代码:
2 { // do the work here.
3 }
4
synchronized 语句将永远等待,但是它时常会放弃已获得的锁以打破潜在的死锁可能。在理想情况下,每个重复等待的超时值比前一个相差一随机值。
改进 wait() 和 notify()
wait() / notify() 系统也有一些问题:
无法检测 wait() 是正常返回还是因超时返回。
无法使用传统条件变量来实现处于一个“信号”(signaled)状态。
太容易发生嵌套的监控(monitor)锁定。
超时检测问题可以通过重新定义 wait() 使它返回一个 boolean 变量 (而不是 void ) 来解决。一个 true 返回值指示一个正常返回,而 false 指示因超时返回。
基于状态的条件变量的概念是很重要的。如果此变量被设置成 false 状态,那么等待的线程将要被阻断,直到此变量进入 true 状态;任何等待 true 的条件变量的等待线程会被自动释放。 (在这种情况下, wait() 调用不会发生阻断。)。通过如下扩展 notify() 的语法,可以支持这个功能:
| notify(); | 释放所有等待的线程,而不改变其下面的条件变量的状态。 |
| notify(true); | 把条件变量的状态设置为 true 并释放任何等待的进程。其后对于 wait() 的调用不会发生阻断。 |
| notify(false); | 把条件变量的状态设置为 false (其后对于 wait() 的调用会发生阻断)。 |
嵌套监控锁定问题非常麻烦,我并没有简单的解决办法。嵌套监控锁定是一种死锁形式,当某个锁的占有线程在挂起其自身之前不释放锁时,会发生这种嵌套监控封锁。下面是此问题的一个例子(还是假设的),但是实际的例子是非常多的:
2 {
3 LinkedList list = new LinkedList();
4 public synchronized void push(Object x)
5 { synchronized(list)
6 { list.addLast( x );
7 notify();
8 }
9 }
10 public synchronized Object pop()
11 { synchronized(list)
12 { if( list.size() <= 0 )
13 wait();
14 return list.removeLast();
15 }
16 }
17 }
18
此例中,在 get() 和 put() 操作中涉及两个锁:一个在 Stack 对象上,另一个在 LinkedList 对象上。下面我们考虑当一个线程试图调用一个空栈的 pop() 操作时的情况。此线程获得这两个锁,然后调用 wait() 释放 Stack 对象上 的锁,但是没有释放在 list 上的锁。如果此时第二个线程试图向堆栈中压入一个对象,它会在 synchronized(list) 语句上永远挂起,而且永远不会被允许压入一个对象。由于第一个线程等待的是一个非空栈,这样就会发生死锁。这就是说,第一个线程永远无法从 wait() 返回,因为由于它占据着锁,而导致第二个线程永远无法运行到 notify() 语句。
在这个例子中,有很多明显的办法来解决问题:例如,对任何的方法都使用同步。但是在真实世界中,解决方法通常不是这么简单。
一个可行的方法是,在 wait() 中按照反顺序释放当前线程获取的 所有 锁,然后当等待条件满足后,重新按原始获取顺序取得它们。但是,我能想象出利用这种方式的代码对于人们来说简直无法理解,所以我认为它不是一个真正可行的方法。如果您有好的方法,请给我发 e-mail。
我也希望能等到下述复杂条件被实现的一天。例如:
2
其中 a 、 b 和 c 是任意对象。