【发布时间】:2013-04-25 09:57:47
【问题描述】:
我想知道如何为我的程序(比如 CUDA 应用程序)计算 GFlops。
我是否需要测量代码中的执行时间和浮点运算的数量?如果我有一个像“logf”这样的操作,它会只算一次失败吗?
【问题讨论】:
-
我怀疑日志函数是 1 flop
-
Log 是一种非常复杂的操作,即使它在一个周期内执行,也可以声称它需要 10 到 100 个 FLO(省略 'P' 代表 'per')。