【发布时间】:2013-09-19 17:53:17
【问题描述】:
我想计算图形硬件的理论峰值性能。嗯,其实我想了解计算。
以 AMD Radeon HD 6670 为例: AMD 加速并行处理编程指南 (http://developer.amd.com/download/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf) 在第 6-42 页的中间告诉我,取 Stream Core 的数量 (96),乘以每个 Stream Core 的每个周期的操作数(让我们取一个使用单精度加法,即 5) 并将其乘以核心时钟 (800 MHz)。结果是:
96 * 5 FLOPS * 800MHz = 384,000 MFLOPS = 384 GFLOPS
同一份文档在第 D-4 页告诉我,这个特定设备的峰值吞吐量为 768 GFLOPS,是我刚刚计算的两倍。维基百科和 AMD 主页声明相同。
所以我的问题是:我在哪里错过了两个因素?
【问题讨论】:
标签: opencl gpu gpgpu amd-processor