技术开发 频道

CUDA 3.1发布 支持函数指针和递归

  【IT168 资讯】今天去NVIDIA官方看到,CUDA 3.1正式版本已经于27号发布下载。

  以下是CUDA 3.1 版本发布要点

  1.GPUDirect(tm)允许第三方设备访问CUDA存储器

  2.在fermi架构的GPU上支持16路并发,允许多达16个内核同时执行

  3.运行时/驱动互操作支持通过缓冲区共享和上下文迁移而混合搭配使用CUDA驱动API、运行时API和数学函数库

  4.新加入的cuda C/C++特性包括:

  1)设备代码支持printf()

  2)支持函数指针和递归,这使得现用算法更易移植到fermi GPU上

  5.一致的visual profiler现在同时支持cuda C/C++和OpenCL

  1)支持运行时的启动/结束取样,这样可以定位于耗时程序的热点

  2)支持cuda驱动API跟踪

  6.数学库性能提升,包括:

  1)erfinvf()函数高达25%的性能提升

  2)在fermi架构GPU上,对于2的n次方转换尺寸,双精度fft性能大幅提升

  3)cublas现在支持流API的数据传输和计算重叠

  4)cufft库中,对于2的n次方数据尺寸,优化了实数和复数转换

  5)提升cublas库中GEMV和SYMV子程序的性能

  6)为fermi架构优化优化了双精度除法和倒数

  7.新加或升级SDK代码示例以展示怎样使用:

  1)在CUDA C/C++内核中使用函数指针

  2)OpenCL/Direct3D缓冲区共享

  3)OpenCL中隐藏马尔可夫模型

  4)微软的Excel GPGPU例子演示如何在GPU使用excel函数

0
相关文章