【发布时间】:2013-09-17 23:23:29
【问题描述】:
我在 XMM 寄存器中有一堆打包的浮点数(使用 SSE 内在函数):
__m128 xmm = _mm_set_ps(4.0f, 3.0f, 2.0f, 1.0f);
我想一次性将所有这些转换为整数。我找到了一个内在函数,它可以满足我的需求 (_mm_cvtps_pi16()),但它会产生 4x16 位 short 而不是完整的 int。一个名为 _mm_cvtps_pi32() 的内在函数产生 int,但仅适用于 xmm 中的两个较低值。我可以使用它,提取值,移动东西并再次使用它,但是有没有更简单的方法?为什么没有简单的 32 位压缩浮点 -> 32 位整数指令?确定两者都适合 XMM 寄存器的相同空间吗?
编辑:好的,我现在看到 _mm_cvtps_pi32() 返回 __m64 而不是 __m128,这意味着它在 MMX 样式的 MM... 寄存器上运行。这可以解释为什么它只返回两个整数,但现在我想知道:
- 为 x64 编译时会遇到问题吗?据报道,那里不支持 __m64...
- 为什么在 SSE 推出时他们没有扩展这条指令?
谢谢!
【问题讨论】:
标签: c++ c sse intrinsics