【发布时间】:2016-05-18 04:49:24
【问题描述】:
我在嵌套在 for k 循环中的 for i 循环中有一个简单的代码行(64 个字节,8 个双精度形式 - 正好是 one i7 cache line):
result[i] += A[k] * sin(B[k] * C[i] + D[k])
我环顾intell intrinsics manual,但似乎迷失了:如何查询这样的功能?
【问题讨论】:
-
四参数操作
a * sin(b * c + d)的内在可能性极小。这不是 CPU 可能拥有专用指令的基本操作。
标签: cpu intel intrinsics instructions