【发布时间】:2012-04-26 15:35:25
【问题描述】:
在this OpenCL reference sheet(断开的链接)的第三页上,有两个具有相同参数的内置向量长度函数:length() 和 half_length()。
这些功能之间有什么区别?我从名字中得知,一个比另一个“更快”,但在什么情况下?它是否会为了提高速度而牺牲准确性?如果不是,为什么要使用length() 而不是fast_length()?
【问题讨论】:
-
通常快速_方法是用速度换取准确性的惯例。
-
改用 OpenCL 参考。您会毫不费力地发现 fast_length 使用 half_sqrt,它不能保证超过 10 位的准确度。
标签: performance opencl gpgpu