【IT168 资讯】上千上万的开发人员现在即可拥有全新支持Windows 和 Linux 的OpenCL可视化剖析器。
利用NVIDIA OpenCL驱动器内的强大性能实质和NVIDIA GPU内的硬件性能信号,OpenCL可视化剖析器为开发人员提供了解决性能瓶颈的视角和优化的机会。
关键特点:
- 真实硬件信号,核心效能和指令发送率的程序剖析;
- 系统内存和GPU专用内存之间内存拷贝的时序;
- 自定义图标以帮助开发人员专注于解决问题;
- 基本的自动分析以揭示warp 串行化问题;
- 轻松输入/输出CSV,进行定制分析;
NVIDIA还设计了颇有用处的OpenCL Best Practices Guide(OpenCL非常好的实务指南)以帮助为CUDA构架编程的OpenCL开发人员执行高性能平行演算法,及理解GPU计算的非常好的实务。
在指南里,以下课题和其它细节在各章节均会讨论:
- 用OpenCL 进行GPU计算;
- 性能测度;
- 内存优化;
- NDRange优化;
- 指令优化;
- 控制流程;
- 性能优化战略
现在,所有注册NVIDIA GPU计算项目开发人员都可拥有OpenCL可视化剖析器,也会包含在随后公开发型的CUDA Toolkit里。在http://www.nvidia.com/content/cudazone/CUDABrowser/downloads/papers/NVIDIA_OpenCL_BestPracticesGuide.pdf
可获得OpenCL非常好的实务指南;
专业开发人员和研究人员,欢迎在以下网址申请该程序:
http://developer.nvidia.com/page/registered_developer_program.html