技术开发 频道

CUDA 3.1 beta 发布

  【IT168 资讯】CUDA 3.1 beta版本发布了!

  性能提高的数学库,包括:

  *在fermi架构的gpu上进行2^n变换尺度的双精度fft变换时,性能有显著提升。

  *CUBLAS中的流操作相关的api支持重叠操作的拷贝和计算。

  * r2c和c2r优化为优化为2 ^ n个数据的大小

  *改进CUBLAS库中GEMV 和SYMV的性能。

  *优化双精度的除法和求倒数的操作。

  visual profiler能同时支持cuda和opencl。具有

  *支持在运行时启动和停止性能分析,以便您可以专注于长时间运行的应用程序的关键部分 。

  *支持cuda驱动api跟踪。

  对fermi架构的gpu的额外的支持。

  *对erfinvf()函数性能的改善。

  * 16路并发内核。

  *支持在设备函数中使用printf()函数。

  *对在fermi架构下的cuda-memcheck的更新。

  驱动/运行时的互操作性 允许在在驱动api代码中使用使用cuda c运行库(和数据库)

  新的sdk代码例子演示了如何使用

  * 在cuda c/c++的内核中使用函数指针

  * OpenCL / Direct3D 共享缓冲区

  * 在opencl使用隐马尔科夫模型。

  * Microsoft Excel GPGPU 的例子展示了如何在gpu上运行excel函数。

  请注意这次有限的测试版本只包括linux,maxos 和windows TCC(tesla集群)的驱动包。标准的Windows图形驱动程序和支持所有NVIDIA GPU的驱动程序包将可与支持CUDA工具包3.1将下月发布。此外,linux下的开发者需注意,此外,Linux开发人员应当注意,在这个版本中,支持CUDA的gdb的硬件调试器还没有准备好 。但会在最终发行版本中放出。而windows下的开发者可以在www.nvidia.com/nsight下载新的visual studio 环境下的 Parallel Nsight。

0
相关文章