技术开发 频道

专访:CUDA 4开启超级计算时代非常好的性能

    【IT168 专稿】2010年,中国的超级计算机天河一号登上超算全球性能Top500榜首的位置,让全世界认识到了基于NVDIA开发的Tesla的CPU+GPU异构计算的强劲威力。说到GPU计算,由于编程模式与传统CPU截然不同,在高性能领域最大的挑战就是如何让GPU编程向通用计算靠拢,否则由GPU硬件所体现出来的优势也就无从谈起。而CUDA简化了并行编程,让更多开发人员能够将应用程序移植到GPU平台,因此,它成为GPU在高性能计算领域延续辉煌的基石。

  近日,IT168记者有幸采访到NVidia(英伟达)GPU计算全球总经理Sanford H Russell先生,他为记者详细讲解了CUDA 4.0的最新特性及发展趋势。

专访:CUDA 4开启超级计算时代非常好的性能
▲图 NVidia(英伟达)GPU计算全球总经理Sanford H Russell先生

  CUDA 4.0新特性

  根据Sanford的介绍, CUDA 1.0主要是针对研究者和尝鲜者;CUDA 2.0的时候,增加了双精度library,主要是针对科学界和高性能计算的研究人士;CUDA 3.0的时候,增加了更多library,同时有了开发工具。到CUDA 4.0的时候,更加易用,功能特性的改进主要涉及应用程序移植的简化、多GPU编程的加速、开发工具的增加和改进三个方面,将有更广泛的开发人员加入到CUDA开发阵营。

  Sanford表示,目前发布的CUDA 4.0为RC(发行候选版)版本,但主要改进已经在众多的测试中显现出来。主要包括以下几方面的特性。

  (1)统一的虚拟地址空间(UVA)简化并行编程

  之前的CUDA版本中,多显卡的设备存储器以及主机端的内存被看做独立的存储器块,各自拥有独立的地址空间。而在CUDA4.0中host端的内存资源和GPU上的设备存储资源被当做一块统一的存储器池,存储器地址统一编码,多GPU之间可以通过PCIe总线直接进行通信,而不再需要通过内存进行中转。同时32位系统上支持超4G寻址空间调试。这个就像一个图书馆,把一本书放进去,原来有几个房间,你需要记住具体位置,而现在变成单独一个房间,大大简化了CUDA开发者的工作。

专访:CUDA 4开启超级计算时代非常好的性能

0
相关文章