GPU技术大会：基于模式的数据并行编程-技术开发专区

GPU技术大会：基于模式的数据并行编程

作者：皮丽华编辑：皮丽华 2011-12-15 17:10 IT168网站原创

【IT168 现场报道】2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕，该大会主要探讨的话题是热门的“GPU计算”等，本次会议邀请了高性能计算领域优异科学家分享GPU计算中最新的科学研究及其商业应用，尤其是GPU计算落地中国的最新成果。为期两天的2011年图形处理器(GPU)技术大会14日在北京开幕。这是一年一度的GPU技术大会首次登陆中国。

GPU技术大会：基于模式的数据并行编程

　　本次会议邀请了高性能计算领域优异科学家分享GPU计算中最新的科学研究及其商业应用，尤其是GPU计算落地中国的最新成果。大会将重点专注科学、学术以及商业等领域中基于GPU计算的最新进展与研究项目。同时，大会举办亿亿次级研讨会与加速基因组研讨会。

　　大会的第二天，来自英伟达的专家王鹏发起了“基于模式的数据并行编程”程序开发主题。本讲座讨论了数据并行编程中的基本并行模式和基本命令，简要介绍了各种基本命令及其实现之后，如何通过实现其底层模式快速、高效地解决并行编程问题。讲座中使用了真实的示例来说明各种技巧，包括分子动力学中的基数排序、元胞列表构建和粒子代码中的MPI几何计算。

　　作为英伟达的并行计算架构，CUDA架构通过利用GPU的处理能力，可大幅提升计算性能。目前为止基于英伟达 CUDA 的GPU销量已达数以百万计，软件开发商、科学家以及研究人员正在各个领域中运用英伟达CUDA ，其中包括图像与视频处理、计算生物学和化学、流体力学模拟、CT图像再现、地震分析以及光线追踪等等。

　　作为最新版本，英伟达CUDA 4.0工具包旨在让并行编程变得更加容易，并且让更多开发人员能够将应用程序移植到GPU上来。该版本软件包含下列三大特性:

　　英伟达GPUDirect 2.0技术–支持一台服务器或工作站内多GPU之间的点对点通信。这让多GPU编程更加轻松并且能够提升应用程序性能。
　　统一虚拟寻址 (UVA) –能够为主系统内存和显卡显存提供一个合并的存储器地址空间，让并行编程变得更快、更容易。
　　Thrust C++模板高性能基元库–能够提供一系列强大的开源C++并行算法和数据结构，这些内容能够让C++开发人员的编程工作变得轻松。与使用标准模板库(STL)以及线程构件(TBB)时相比，通过利用Thrust，并行排序等例程的速度可提升5至100倍。

　　总之，CUDA 4.0统一的虚拟寻址、GPU间通信以及增强型C++模板库让更多开发人员能够利用GPU计算。

关注我们