技术开发 频道

深入了解Java 5.0的垃圾收集

  【IT168 技术文档】 

  内存管理是影响软件应用程序性能的一个重要因素。与实际的数据计算时间相比,分配和卸载内存所用的时间更长。

  虽然C++可对内存分配与释放进行直接控制,Java利用垃圾收集来回收程序不再需要的内存,试图掌握内存管理。但是,在需要实时性能时,与垃圾收集有关的“暂停”一直是人们反对应对Java的中心论点。

  垃圾收集是一个周期性的过程,它中断程序的正常执行,分析对象引用,并回收被分配但不再被引用访问的内存。在大型Java应用程序中,垃圾收集暂停可能持续几秒钟,这段时间足以中断任何类型的实时通信或控制系统。

  因此,垃圾收集提供的内存提取要求一些开发者更仔细地考虑内存管理问题。即使Java并没有提供和C++同等级别的内存分配控制,编程模式仍然会对Java应用程序的内存性能产生重大影响。

  在本文中,我将简单回顾一下Java 5.0的垃圾收集调整功能。

  Java 5.0垃圾收集原理

  Java 1.5新特性??工效学??的目标是通过最少的命令行调整,为JVM提供优良的性能。工效学试图为一个应用程序选择非常好的的垃圾收集器、堆大小与运行时间编译器。

  垃圾收集器的选择何时会对用户产生影响呢?对许多应用程序来说,它根本没有影响。也就是说,在垃圾收集产生的暂停的频率与持续时间适度的情况下,应用程序可在其规范内执行。如果一个大型应用程序出现扩充,产生大量线程、处理器、套接字和许多内存,就会出现例外。

  如果一个对象再也不能通过运行程序中的任何指针到达,则视其为垃圾。最直接的垃圾收集运算法则简单地在每个可到达的对象间迭代。那么,剩下的对象即为垃圾。这一方法所用的时间与活动对象的数目成比例关系,且禁止用于维护许多活动数据的大型应用程序。

  从Java 2开始,虚拟机合并了许多应用分代收集组合的各种收集运算法则。尽管简单的垃圾收集检查堆中的每一个活动对象,但分代收集利用多数应用程序的几个凭经验观察得到的特性来避免额外工作。这些观察得到的特性中最为重要的一个就是所谓的早期失效率。许多对象分配以后很快“已经死亡”。例如,迭代器对象仅在单独循环中存活。为优化这种情况,我们对内存进行分代管理,或在内存池中保留不同年龄的对象。当一代装满时,就对这个代进行垃圾收集。对象被分配到更年龄对象代,或新生代中。由于早期失效率,多数对象在那里死亡。

  如果垃圾收集器成为瓶颈,你可能希望自定义代的大小。详细检查垃圾收集器的输出,然后探究单个性能计量单位对垃圾收集器参数的灵敏度。

  初始化时,保留一个最大的地址空间,在必要时才分配给物理内存。为对象内存保留的全部地址空间可分为新生代和旧生代。新生代由eden和两个生存空间组成。对象最初分配到eden中。任何时候,一个生存空间为空,并作为下一个空间的目的地,在eden与另一个生存空间中复制活动对象的集合。对象以这种方式在生存空间中复制,直到它们老化,或复制到旧生代中。与旧生代关系密切的第三个代称为永生代。这是一个特别的代,因为它保留虚拟机所需要的数据,来描述在Java语言中没有等同物的对象。例如,描述类与方法的对象存储在永生代中。

  性能因素

  Java应用程序(特别是垃圾收集)有两个性能计量单位:吞吐量与暂停。吞吐量是指在一段较长时间内,没有用于垃圾收集的时间百分比。吞吐量包括用于分配的时间(但用于调整分配速度的时间一般不包括在内)。暂停是应用程序因为垃圾收集而出现的停顿时间。

  一些用户还对其他因素较为敏感。例如,占用率(footprint) 是一批工作进程的集合,以页和缓冲行数计量,在物理内存有限或者有很多进程的系统中,占用率可表示扩展性。

  反应性(Promptness)是对象死去的时间和内存变为可用时的时间差,是分布系统,包括远程方法调用(RMI)中的重要因素。

  通常来说,特定的代大小选择这些因素之间的平衡作用。例如,一个非常大的新生代的吞吐量可以最大,但这要以牺牲占用率、反应性和暂停时间为代价。你也可以牺牲吞吐量,应用一个小型的新生代来使新生代暂停时间最短。

  如果你希望提高有大量处理器的应用程序的性能,你应该使用吞吐量收集器。你可以用命令行标记-XX:+UseParallelGC来激活吞吐量收集器。你可以用ParallelGCThreads选项-XX:ParallelGCThreads=来控制垃圾收集器线程的数量。

  最大暂停时间目标用命令行标记-XX:MaxGCPauseMillis=来指定,这是对吞吐量收集器的一个暗示,即它需要毫秒或更短的暂停时间。存在有许多调整代大小的选项,如-XX:YoungGenerationSizeIncrement=用于新生代;而-XX:TenuredGenerationSizeIncrement=用于旧生代。

  如果应用程序受益于较短的垃圾收集器暂停,且能够在应用程序运行时与垃圾收集器共享处理器资源,我建议使用并行低暂停收集器。如果旧生代占用率超出初始占用率(即当前堆的百分比用于并发收集启动之前),并发收集将启动。

  默认的初始占用率约为68%。你可以用参数-XX:CMSInitiatingOccupancyFraction=进行设置,这里的是当前旧生代大小百分比。你能够以并发阶段递增完成的方式使用并发收集器。这种模式(这里称之为”i-cms”)将收集器并发完成的工作分割成时间小段,安排在新生代收集之间。当需要并发收集器提供短暂停时间的应用程序在拥有少量处理器的机器上运行时,这一特性很有帮助。

  微调垃圾收集

  命令行参数-verbose:gc打印每个收集阶段的信息。如果打开此参数,你会在每个垃圾收集阶段看到相似的输出结果。例如:

  [GC 325407K->83000K(776768K), 0.2300771 secs]

  [GC 325816K->83372K(776768K), 0.2454258 secs]

  [Full GC 267628K->83769K(776768K), 1.8479984 secs]

  有两个次要收集和一个主要收集(完全GC)。标记-XX:+PrintGCDetails打印收集的其他信息。标记-XX:+PrintGCTimeStamps打印每次收集开始的时间。列表A是两个标记被设定后的结果。

  另外,主要收集的信息由旧生代描述。在这里,旧生代使用率减少到约10%,所用时间约为0.13秒。

  许多参数影响代的大小。在虚拟机的初始阶段,堆的整个空间被保留。你可以用-Xmx选项指定保留空间的大小。如果-Xms参数的值小于-Xmx参数的值,表示不是所有的保留空间立即提交给虚拟机。堆的不同部分(永生代、旧生代和新生代)必要时可能会超出虚拟空间的限制。

  默认情况下,在每次收集时,虚拟机增大或缩小堆的大小,努力将自由空间与活动对象的比例保持在一个特定的范围内。这个范围是一个百分数,由参数-XX:MinHeapFreeRatio=和-XX:MaxHeapFreeRatio=设定,-Xms为下限,-Xmx为上限。除非有暂停问题,否则向虚拟机许可尽可能多的内存。默认的大小(64MB)一般都太小。你可以在Sun网站找到其他VM选项的说明。

  你还可以为新生代的堆设定一个比例。新生代越大,次要收集就越少发生。但是,在一个有限大小的堆中,新生代越大就意味着旧生代越小,这会增加主要收集的频率。最优选择要根据应用程序分配的对象的寿命分配来决定。

  新生代的大小由NewRatio控制。例如,设定-XX:NewRatio=3说明新生代与旧生代之比为1:3。如果希望的话,可用参数SurvivorRatio来调整生存空间的大小,但它并不如性能重要。

  例如,-XX:SurvivorRatio=6说明每个生存空间与eden的比为1:6。除非你发现过多主要收集或暂停时间问题,向新生代许可大量内存。

  Java 5.0执行了三个不同的垃圾收集器。吞吐量收集器使用新生代收集器的并行版本。如果-XX:+UseParallelGC选项传递给命令行,则使用并行收集器;如果-Xincgc或-XX:+UseConcMarkSweepGC选项传递给命令行,则使用并发收集器。

  在这种情况下,收集过程中应用程序会出现短期暂停。如果-XX:+UseTrainGC传递经命令行,则使用递增式低暂停收集器。将来版本将不支持这一功能,但如果你想了解更多信息,请访问Sun的关于应用这个收集器的文件资料。(提示:不要同时使用-XX:+UseParallelGC和-XX:+UseConcMarkSweepGC。)

  结论

  根据应用程序的需求,垃圾收集可能成为各种应用程序的瓶颈。通过了解应用程序需求与垃圾收集选项,可以减轻垃圾收集的影响。

0
相关文章