技术开发 频道

CUDA 3.0 编程模型

  2.4 异构编程

  如图2-3所示,CUDA编程模型假设CUDA线程在物理上独立的设备上执行,设备作为主机的协处理器,主机运行C程序。例如,内核在GPU上执行,而C程序的其它部分在CPU上执行就是这种模式。

  CUDA编程模型同时假设主机和设备各自都维护着自己独立的DRAM存储器空间,各自被称为主机存储器空间和设备存储器空间。因此,程序通过调用CUDA 运行时,来管理对内核可见的全局、常量和纹理存储器空间(参看第三章)。这包括设备存储器分配和释放,也包括在主机和设备间的数据传输。

 

  2.5 计算能力

  设备的计算能力由主修订号和次修订号定义。

  主修订号相同的设备基于相同的核心架构。Fermi架构的主修订号为2。以前的设备的计算能力都是1.x(它们的主修订号为1)。

  次修订号对应着对核心架构的增量提升,也可能包含了新特性。

  附录A列出了所有支持CUDA的设备,包括它们的计算能力。附录G给出了各计算能力设备的技术规范。

0
相关文章