【IT168 资讯】2012 年 5 月 17 日 消息, 英伟达公司于今日发布了全新系列的英伟达 (NVIDIA) Tesla GPU,该系列产品基于革命性的英伟达 (NVIDIA) Kepler GPU 计算架构,这款架构让更广范围的高性能计算 (HPC) 科学与技术应用程序能够更轻松地利用 GPU 加速的计算性能。
全新的英伟达 Tesla K10 和 K20 GPU 是计算加速器,旨在处理全球最复杂的 HPC 难题。在 Kepler 设计过程中,英伟达专注于高性能和优异节能性,因此 Kepler 的效率可达上一代架构英伟达 (NVIDIA®) Fermi 的三倍。Fermi 架构在两年前发布之时曾树立了并行计算的新标准。
英伟达首席科学家兼研究副总裁 Bill Dally 表示:“Fermi 是计算领域的一次重大进步。它确立了 GPU 加速计算在高性能计算中的上层地位,让数十万开发者加入了 GPU 计算平台的阵营。Kepler 将同样具有颠覆性,由于简单易用、广泛适用以及高效等特点,Kepler 架构将让 GPU 广泛应用于技术计算领域。”
作为英伟达一系列公布内容的一部分,英伟达 Tesla K10 和 K20 GPU 曾在 GPU 技术大会 (GTC) 上正式推出,所有公布的内容均可在 GTC 在线新闻中心找到。
英伟达开发了一系列创新架构技术,这些技术让 Kepler GPU 性能强劲、十分节能,而且还更适用于更广范围的开发者和应用程序。主要创新如下:
• SMX 流式多处理器 —— SMX 流式多处理器是每一颗 GPU 的基本构成模块,我们完全专为高性能和节能性而对其进行了重新设计。它在每瓦特性能方面可达 Fermi 流式多处理器的三倍,因而以区区 10 台服务器机柜即可打造出计算性能高达 1 Petaflop 的超级计算机。SMX 的节能性是通过增加四倍数量的英伟达 (NVIDIA®) CUDA 架构核心来实现的,它同时还降低了每个核心以及 GPU 电源门控零件在闲置时的时钟频率,还最大限度增大了专门用于并行处理核心而非控制逻辑的 GPU 区域。
• 动态并行机制 —— 该功能让 GPU 线程能够动态生成新线程,从而让 GPU 动态适应数据。这大大简化了并行编程,让 GPU 加速能够应用到更广范围的流行算法上,例如自适应网格细分、高速多级法以及多栅法。
• Hyper-Q —— 该技术让多个 CPU 核心能够同时利用单个 Kepler GPU 上的诸多 CUDA 架构核心。这大大提升了 GPU 的利用率、缩短了 CPU 闲置时间、提高了可编程性。Hyper-Q 非常适合采用 MPI 的集群应用程序。
英伟达 GPU 工程高级副总裁兼 Kepler 首席架构师 Jonah Alben 表示:“我们在设计 Kepler 的过程中注重三点:性能、效率以及易于使用。它是 GPU 加速计算领域中的一个重要里程碑,将在计算研究领域中孕育出下一轮突破。”
英伟达 Tesla K10 和 K20 GPU
英伟达 Tesla K10 GPU 能够为信号、图像以及地震处理应用程序提供全球最高的数据吞吐能力。英伟达 Tesla K10 加速卡专为油气勘探和国防领域的客户进行了优化,一块加速卡包含两颗 GK104 Kepler GPU,总体单精度浮点峰值性能可达 4.58 Teraflops,存储器带宽可达每秒 320 GB。
英伟达 Tesla K20 GPU 是 Tesla GPU 系列产品中的全新旗舰产品,该 GPU 专为计算量最密集的 HPC 环境而设计。预计英伟达 Tesla K20 将成为全球最高性能、最节能的 GPU,该产品计划于 2012 年第四季度发布。
英伟达 Tesla K20 是基于 GK110 Kepler GPU 而打造的。该 GPU 的双精度性能比 Fermi 架构的英伟达 Tesla 产品高三倍,而且还支持 Hyper-Q 和动态并行机制等功能。GK110 GPU 预计将被新型 Titan 超级计算机和 Blue Waters 计算机所采用。前者来自美国田纳西橡树岭国家实验室,后者来自美国伊利诺伊大学厄本那香槟分校的国家超级计算应用中心。
IDC 高性能计算项目副总裁 Earl C. Joseph 指出:“在 Fermi 发布以来的两年里,混合式计算现已成为大量关键 HPC 应用程序实现更高性能的普遍方式。在未来两年里,我们预计 GPU 将越来越适合在诸多应用程序上提供更高性能。”
CUDA 5 并行编程平台预览版
除了 Kepler 架构以外,英伟达今天还发布了 CUDA 5 并行编程平台的预览版。英伟达 GPU 计算注册开发者计划的 20,000 多名会员均可获得该平台。这一平台将让开发者能够开始探索利用新型 Kepler GPU 的方法,其中包括动态并行机制。
CUDA 5 并行编程模型计划将于 2012 年第三季度大范围上市。开发者可以在 CUDA 网站注册参加 GPU 计算注册开发者计划,获得这一预览版本。