【发布时间】:2015-12-14 09:45:02
【问题描述】:
我不是在寻找可移植的 SIMD 实现。
我所需要的只是:一个位精确的实现。只要速度不是特别慢,性能并不重要。
我想将它用于早期开发和测试,这样我就可以在主机上编译和运行前 10 次以上的迭代。然后在 ARM 目标上交叉编译和微调性能。
当我使用像 described here 这样的 TI DSP 时,我已经习惯了这种开发周期。当我搬到 ARM NEON 时,我想继续这样做。
这已经完成了吗,还是我需要发明轮子?
【问题讨论】:
-
我不知道任何可移植的实现,除了像 QEMU 这样的 VM。将 linux ARM 发行版安装到 VM 中并编译。这就是我在家里所做的。
-
@user1095108 是的,这是一种方法。但随后我需要将 python 或 matlab 等开发工具与仿真 VM 连接,而不是编译为库的 C 函数。我的直觉是,与 VM 接口并不比与目标板接口容易,因此我失去了在主机上运行它的大部分优势。
-
我也对这样的工具感兴趣,你发明过吗?