【IT168 资讯】CUDA 3.1 beta版本发布了!
性能提高的数学库,包括:
*在fermi架构的gpu上进行2^n变换尺度的双精度fft变换时,性能有显著提升。
*CUBLAS中的流操作相关的api支持重叠操作的拷贝和计算。
* r2c和c2r优化为优化为2 ^ n个数据的大小
*改进CUBLAS库中GEMV 和SYMV的性能。
*优化双精度的除法和求倒数的操作。
visual profiler能同时支持cuda和opencl。具有
*支持在运行时启动和停止性能分析,以便您可以专注于长时间运行的应用程序的关键部分 。
*支持cuda驱动api跟踪。
对fermi架构的gpu的额外的支持。
*对erfinvf()函数性能的改善。
* 16路并发内核。
*支持在设备函数中使用printf()函数。
*对在fermi架构下的cuda-memcheck的更新。
驱动/运行时的互操作性 允许在在驱动api代码中使用使用cuda c运行库(和数据库)
新的sdk代码例子演示了如何使用
* 在cuda c/c++的内核中使用函数指针
* OpenCL / Direct3D 共享缓冲区
* 在opencl使用隐马尔科夫模型。
* Microsoft Excel GPGPU 的例子展示了如何在gpu上运行excel函数。
请注意这次有限的测试版本只包括linux,maxos 和windows TCC(tesla集群)的驱动包。标准的Windows图形驱动程序和支持所有NVIDIA GPU的驱动程序包将可与支持CUDA工具包3.1将下月发布。此外,linux下的开发者需注意,此外,Linux开发人员应当注意,在这个版本中,支持CUDA的gdb的硬件调试器还没有准备好 。但会在最终发行版本中放出。而windows下的开发者可以在www.nvidia.com/nsight下载新的visual studio 环境下的 Parallel Nsight。