【发布时间】:2014-06-13 06:33:22
【问题描述】:
我在汇编中编写了一些霓虹灯代码,旨在最大限度地优化。尽管由于寄存器冲突和流水线导致的延迟减少了,但它只显示了 1 个周期差异,即在 n.70-0 之前,在 n.69-0 之后。为什么它显示这样我不明白。 这是我的示例代码
优化前http://pulsar.webshaker.net/ccc/sample-6b7ba7c2 优化后http://pulsar.webshaker.net/ccc/sample-d59091b4
我对脉冲星计算器有很多疑问。 1. n.16-0 1c d0:1 这里 n 代表什么? 2. a.23-0 2c q6l:1 VMLA.I16 q6、q9、D0[2] 代表什么? l:1 是什么意思? 23 是周期数吗? 3. count Time 是指执行代码的总时间吗? 希望有人能帮助我解决这些疑问....
【问题讨论】:
-
您可以通过google translator 运行网页,底部的图例试图像亚历山德罗那样解释事情。
-
谢谢。其实我也试过谷歌翻译,但他没有解释这些事情。因此,只有我通过 stackoverflow 接近。
标签: arm inline-assembly simd neon cortex-a8