【发布时间】:2016-09-14 08:14:45
【问题描述】:
4 倍 vld1 和 1 倍 vld4 之间最快的是什么。显然,加载的数据是不一样的,但如果我可以选择,什么是最好的还是一样的?
pld[in]
vld1.u8 { d0 }, [in]!
vld1.u8 { d1 }, [in]!
vld1.u8 { d2 }, [in]!
vld1.u8 { d3 }, [in]!
对比
pld[in]
vld4.u8 { d0, d1, d2, d3 }, [in]!
【问题讨论】:
-
您知道
vld1仍然可以获取最多 4 个连续寄存器的列表,对吧? -
不,我不知道 :-( 我觉得自己很愚蠢。我现在彻底阅读了文档...