【IT168 资讯】今天去NVIDIA官方看到,CUDA 3.1正式版本已经于27号发布下载。
以下是CUDA 3.1 版本发布要点
1.GPUDirect(tm)允许第三方设备访问CUDA存储器
2.在fermi架构的GPU上支持16路并发,允许多达16个内核同时执行
3.运行时/驱动互操作支持通过缓冲区共享和上下文迁移而混合搭配使用CUDA驱动API、运行时API和数学函数库
4.新加入的cuda C/C++特性包括:
1)设备代码支持printf()
2)支持函数指针和递归,这使得现用算法更易移植到fermi GPU上
5.一致的visual profiler现在同时支持cuda C/C++和OpenCL
1)支持运行时的启动/结束取样,这样可以定位于耗时程序的热点
2)支持cuda驱动API跟踪
6.数学库性能提升,包括:
1)erfinvf()函数高达25%的性能提升
2)在fermi架构GPU上,对于2的n次方转换尺寸,双精度fft性能大幅提升
3)cublas现在支持流API的数据传输和计算重叠
4)cufft库中,对于2的n次方数据尺寸,优化了实数和复数转换
5)提升cublas库中GEMV和SYMV子程序的性能
6)为fermi架构优化优化了双精度除法和倒数
7.新加或升级SDK代码示例以展示怎样使用:
1)在CUDA C/C++内核中使用函数指针
2)OpenCL/Direct3D缓冲区共享
3)OpenCL中隐藏马尔可夫模型
4)微软的Excel GPGPU例子演示如何在GPU使用excel函数