【发布时间】:2014-10-25 22:51:49
【问题描述】:
假设我有一个 128 寄存器持有一些浮点数 [x1,x2,x3,x4] 和另一个持有 [y1,y2,y3,y4]。 在性能方面,获得类似 [x1,y1,x2,y2] 的最佳方法是什么?
我想我可以多次移动寄存器,使用临时变量,然后在多个步骤中组合它们,但我想知道我是否缺少一些可以让我的生活更轻松的方便指令。我认为这是一种常见的做法,所以我想知道这里的最佳做法是什么。
谢谢!
【问题讨论】:
标签: intel sse intrinsics avx