技术开发 频道

实现非阻塞套接字的一种简单方法

  【IT168 技术文章】许多程序员在使用 Java 语言编写 Internet 客户程序时并没有考虑这个问题,主要是因为在以前只有一种选择――阻塞通信。但是现在 Java 程序员有了新的选择,因此我们编写的每个客户程序也许都应该考虑一下。

  非阻塞通信在 Java 2 SDK 的 1.4 版被引入 Java 语言。如果您曾经使用该版本编过程序,可能会对新的 I/O 库(NIO)留下了印象。在引入它之前,非阻塞通信只有在实现第三方库的时候才能使用,而第三方库常常会给应用程序引入缺陷。

  NIO 库包含了文件、管道以及客户机和服务器套接字的非阻塞功能。库中缺少的一个特性是安全的非阻塞套接字连接。在 NIO 或者 JSSE 库中没有建立安全的非阻塞通道类,但这并不意味着不能使用安全的非阻塞通信。只不过稍微麻烦一点。

  阻塞和非阻塞通信

  阻塞通信意味着通信方法在尝试访问套接字或者读写数据时阻塞了对套接字的访问。在 JDK 1.4 之前,绕过阻塞限制的方法是无限制地使用线程,但这样常常会造成大量的线程开销,对系统的性能和可伸缩性产生影响。java.nio 包改变了这种状况,允许服务器有效地使用 I/O 流,在合理的时间内处理所服务的客户请求。

  没有非阻塞通信,这个过程就像我所喜欢说的“为所欲为”那样。基本上,这个过程就是发送和读取任何能够发送/读取的东西。如果没有可以读取的东西,它就中止读操作,做其他的事情直到能够读取为止。当发送数据时,该过程将试图发送所有的数据,但返回实际发送出的内容。可能是全部数据、部分数据或者根本没有发送数据。

  阻塞与非阻塞相比确实有一些优点,特别是遇到错误控制问题的时候。在阻塞套接字通信中,如果出现错误,该访问会自动返回标志错误的代码。错误可能是由于网络超时、套接字关闭或者任何类型的 I/O 错误造成的。在非阻塞套接字通信中,该方法能够处理的唯一错误是网络超时。为了检测使用非阻塞通信的网络超时,需要编写稍微多一点的代码,以确定自从上一次收到数据以来已经多长时间了。

  哪种方式更好取决于应用程序。如果使用的是同步通信,如果数据不必在读取任何数据之前处理的话,阻塞通信更好一些,而非阻塞通信则提供了处理任何已经读取的数据的机会。而异步通信,如 IRC 和聊天客户机则要求非阻塞通信以避免冻结套接字。

  创建传统的非阻塞客户机套接字

  Java NIO 库使用通道而非流。通道可同时用于阻塞和非阻塞通信,但创建时默认为非阻塞版本。但是所有的非阻塞通信都要通过一个名字中包含 Channel 的类完成。在套接字通信中使用的类是 SocketChannel, 而创建该类的对象的过程不同于典型的套接字所用的过程,如清单 1 所示。

  清单 1. 创建并连接 SocketChannel 对象

1 SocketChannel sc = SocketChannel.open();
2 sc.connect("www.ibm.com",80);
3 sc.finishConnect();
4

  必须声明一个 SocketChannel 类型的指针,但是不能使用 new 操作符创建对象。相反,必须调用 SocketChannel 类的一个静态方法打开通道。打开通道后,可以通过调用 connect() 方法与它连接。但是当该方法返回时,套接字不一定是连接的。为了确保套接字已经连接,必须接着调用 finishConnect() 。

  当套接字连接之后,非阻塞通信就可以开始使用 SocketChannel 类的 read() 和 write() 方法了。也可以把该对象强制转换成单独的 ReadableByteChannel 和 WritableByteChannel 对象。无论哪种方式,都要对数据使用 Buffer 对象。因为 NIO 库的使用超出了本文的范围,我们不再对此进一步讨论。

  当不再需要套接字时,可以使用 close() 方法将其关闭:

1 sc.close();
2

  这样就会同时关闭套接字连接和底层的通信通道。

  创建替代的非阻塞的客户机套接字

  上述方法比传统的创建套接字连接的例程稍微麻烦一点。不过,传统的例程也能用于创建非阻塞套接字,不过需要增加几个步骤以支持非阻塞通信。

  SocketChannel 对象中的底层通信包括两个 Channel 类: ReadableByteChannel 和 WritableByteChannel。 这两个类可以分别从现有的 InputStream 和 OutputStream 阻塞流中使用 Channels 类的 newChannel() 方法创建,如清单 2 所示:

  清单 2. 从流中派生通道

1 ReadableByteChannel rbc = Channels.newChannel(s.getInputStream());
2 WriteableByteChannel wbc = Channels.newChannel(s.getOutputStream());
3

  Channels 类也用于把通道转换成流或者 reader 和 writer。这似乎是把通信切换到阻塞模式,但并非如此。如果试图读取从通道派生的流,读方法将抛出 IllegalBlockingModeException 异常。

  相反方向的转换也是如此。不能使用 Channels 类把流转换成通道而指望进行非阻塞通信。如果试图读从流派生的通道,读仍然是阻塞的。但是像编程中的许多事情一样,这一规则也有例外。

  这种例外适合于实现 SelectableChannel 抽象类的类。 SelectableChannel 和它的派生类能够选择使用阻塞或者非阻塞模式。 SocketChannel 就是这样的一个派生类。

  但是,为了能够在两者之间来回切换,接口必须作为 SelectableChannel 实现。对于套接字而言,为了实现这种能力必须使用 SocketChannel 而不是 Socket 。

  回顾一下,要创建套接字,首先必须像通常使用 Socket 类那样创建一个套接字。套接字连接之后,使用 清单 2中的两行代码把流转换成通道。

  清单 3. 创建套接字的另一种方法

1 Socket s = new Socket("www.ibm.com", 80);
2 ReadableByteChannel rbc = Channels.newChannel(s.getInputStream());
3 WriteableByteChannel wbc = Channels.newChannel(s.getOutputStream());
4

  如前所述,这样并不能实现非阻塞套接字通信――所有的通信仍然在阻塞模式下。在这种情况下,非阻塞通信必须模拟实现。模拟层不需要多少代码。让我们来看一看。

  从模拟层读数据

  模拟层在尝试读操作之前首先检查数据的可用性。如果数据可读则开始读。如果没有数据可用,可能是因为套接字被关闭,则返回表示这种情况的代码。在清单 4 中要注意仍然使用了 ReadableByteChannel 读,尽管 InputStream 完全可以执行这个动作。为什么这样做呢?为了造成是 NIO 而不是模拟层执行通信的假象。此外,还可以使模拟层与其他通道更容易结合,比如向文件通道内写入数据。

  清单 4. 模拟非阻塞的读操作

1 /* The checkConnection method returns the character read when
2    determining if a connection is open.
3 */
4 y = checkConnection();
5 if(y <= 0) return y;
6 buffer.putChar((char ) y);
7 return rbc.read(buffer);
8

  向模拟层写入数据

  对于非阻塞通信,写操作只写入能够写的数据。发送缓冲区的大小和一次可以写入的数据多少有很大关系。缓冲区的大小可以通过调用 Socket 对象的 getSendBufferSize() 方法确定。在尝试非阻塞写操作时必须考虑到这个大小。如果尝试写入比缓冲块更大的数据,必须拆开放到多个非阻塞写操作中。太大的单个写操作可能被阻塞。

  清单 5. 模拟非阻塞的写操作

1 int x, y = s.getSendBufferSize(), z = 0;
2 int expectedWrite;
3 byte [] p = buffer.array();
4 ByteBuffer buf = ByteBuffer.allocateDirect(y);
5 /* If there isn't any data to write, return, otherwise flush the stream */
6 if(buffer.remaining() == 0) return 0;
7 os.flush()
8 for(x = 0; x < p.length; x += y)
9 {
10     if(p.length - x < y)
11     {
12         buf.put(p, x, p.length - x);
13         expectedWrite = p.length - x;
14     }
15     else
16     {
17         buf.put(p, x, y);
18         expectedWrite = y;
19     }
20     
21     /* Check the status of the socket to make sure it's still open */
22     
23     if(!s.isConnected()) break;
24     /* Write the data to the stream, flushing immediately afterward */
25     buf.flip();
26     z = wbc.write(buf); os.flush();
27     if(z < expectedWrite) break;
28     buf.clear();
29     
30 }
31 if(x > p.length) return p.length;
32 else if(x == 0) return -1;
33 else return x + z;
34

  与读操作类似,首先要检查套接字是否仍然连接。但是如果把数据写入 WritableByteBuffer 对象,就像清单 5 那样,该对象将自动进行检查并在没有连接时抛出必要的异常。在这个动作之后开始写数据之前,流必须立即被清空,以保证发送缓冲区中有发送数据的空间。任何写操作都要这样做。发送到块中的数据与发送缓冲区的大小相同。执行清除操作可以保证发送缓冲不会溢出而导致写操作被阻塞。

  因为假定写操作只能写入能够写的内容,这个过程还必须检查套接字保证它在每个数据块写入后仍然是打开的。如果在写入数据时套接字被关闭,则必须中止写操作并返回套接字关闭之前能够发送的数据量。

  BufferedOutputReader 可用于模拟非阻塞写操作。如果试图写入超过缓冲区两倍长度的数据,则直接写入缓冲区整倍数长度的数据(缓冲余下的数据)。比如说,如果缓冲区的长度是 256 字节而需要写入 529 字节的数据,则该对象将清除当前缓冲区、发送 512 字节然后保存剩下的 17 字节。

  对于非阻塞写而言,这并非我们所期望的。我们希望分次把数据写入同样大小的缓冲区中,并最终把全部数据都写完。如果发送的大块数据留下一些数据被缓冲,那么在所有数据被发送的时候,写操作就会被阻塞。

  模拟层类模板

  整个模拟层可以放到一个类中,以便更容易和应用程序集成。如果要这样做,我建议从 ByteChannel 派生这个类。这个类可以强制转换成单独的 ReadableByteChannel 和 WritableByteChannel 类。

  清单 6 给出了从 ByteChannel 派生的模拟层类模板的一个例子。本文后面将一直使用这个类表示通过阻塞连接执行的非阻塞操作。

  清单 6. 模拟层的类模板

1 public class nbChannel implements ByteChannel
2 {
3     Socket s;
4     InputStream is; OutputStream os;
5     ReadableByteChannel rbc;
6     WritableByteChannel wbc;
7     
8     public nbChannel(Socket socket);
9     public int read(ByteBuffer dest);
10     public int write(ByteBuffer src);
11     public void close();
12         
13     protected int checkConnection();
14 }
15

  使用模拟层创建套接字

  使用新建的模拟层创建套接字非常简单。只要像通常那样创建 Socket 对象,然后创建 nbChannel 对象就可以了,如清单 7 所示:

  清单 7. 使用模拟层

1 Socket s = new Socket("www.ibm.com", 80);
2 nbChannel socketChannel = new nbChannel(s);
3 ReadableByteChannel rbc = (ReadableByteChannel)socketChannel;
4 WritableByteChannel wbc = (WritableByteChannel)socketChannel;
5
0
相关文章