矩阵乘法的高效实现 ARM cortex A9 - Xilinx SDK答案

【问题标题】：Efficient implementation of matrix multiplication ARM cortex A9 - Xilinx SDK矩阵乘法的高效实现 ARM cortex A9 - Xilinx SDK
【发布时间】：2021-03-09 16:27:22
【问题描述】：

是否有任何简单的方法库可以使用 Xilinx SDK 在 ARM CortexA9 双核上实现高效（最大可能速度）线性代数？

我正在使用带有双核 Arm 处理器的 zybo z7 开发板，我想在 Xilinx SDK 上实现一个简单的神经网络，其中一个卷积层后跟一个密集层。具体来说，在 Arm 上传输基于 python numpy 的模型。我阅读了一些 ARM 和 SIMD 库的手册，但我不想深入研究。

对我来说，一个简单的方法是使用库并像 python 中的 numpy 一样自己（快速）执行乘法/点积/卷积等，并避免纯 for...loop 语法。举个例子就好了！

感谢您的宝贵时间

【问题讨论】：

如果您要求推荐图书馆，您应该在其他地方询问。

标签： c arm linear-algebra xilinx zynq

【解决方案1】：

您可以尝试使用TensorFlow使用的Eigen库来实现矩阵计算，或者您甚至可以尝试使用已经在ARM-Cortex M系列处理器上测试过的TensorFlow lite。

【讨论】：

非常感谢！它适用于高性能