【IT168 现场报道】2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕,该大会主要探讨的话题是热门的“GPU计算”等,本次会议邀请了高性能计算领域优异科学家分享GPU计算中最新的科学研究及其商业应用,尤其是GPU计算落地中国的最新成果。为期两天的2011年图形处理器(GPU)技术大会14日在北京开幕。这是一年一度的GPU技术大会首次登陆中国。
本次会议邀请了高性能计算领域优异科学家分享GPU计算中最新的科学研究及其商业应用,尤其是GPU计算落地中国的最新成果。大会将重点专注科学、学术以及商业等领域中基于GPU计算的最新进展与研究项目。同时,大会举办亿亿次级研讨会与加速基因组研讨会。
大会的第二天,来自英伟达的专家王鹏发起了“基于模式的数据并行编程”程序开发主题。本讲座讨论了数据并行编程中的基本并行模式和基本命令,简要介绍了各种基本命令及其实现之后,如何通过实现其底层模式快速、高效地解决并行编程问题。讲座中使用了真实的示例来说明各种技巧,包括分子动力学中的基数排序、元胞列表构建和粒子代码中的MPI几何计算。
作为英伟达的并行计算架构,CUDA架构通过利用GPU的处理能力,可大幅提升计算性能。目前为止基于英伟达 CUDA 的GPU销量已达数以百万计,软件开发商、科学家以及研究人员正在各个领域中运用英伟达CUDA ,其中包括图像与视频处理、计算生物学和化学、流体力学模拟、CT图像再现、地震分析以及光线追踪等等。
作为最新版本,英伟达CUDA 4.0工具包旨在让并行编程变得更加容易,并且让更多开发人员能够将应用程序移植到GPU上来。 该版本软件包含下列三大特性:
- 英伟达GPUDirect 2.0技术–支持一台服务器或工作站内多GPU之间的点对点通信。这让多GPU编程更加轻松并且能够提升应用程序性能。
- 统一虚拟寻址 (UVA) –能够为主系统内存和显卡显存提供一个合并的存储器地址空间,让并行编程变得更快、更容易。
- Thrust C++模板高性能基元库–能够提供一系列强大的开源C++并行算法和数据结构,这些内容能够让C++开发人员的编程工作变得轻松。与使用标准模板库(STL)以及线程构件(TBB)时相比,通过利用Thrust,并行排序等例程的速度可提升5至100倍。
总之,CUDA 4.0统一的虚拟寻址、GPU间通信以及增强型C++模板库让更多开发人员能够利用GPU计算。