【问题标题】:Efficient implementation of matrix multiplication ARM cortex A9 - Xilinx SDK矩阵乘法的高效实现 ARM cortex A9 - Xilinx SDK
【发布时间】:2021-03-09 16:27:22
【问题描述】:

是否有任何简单的方法库可以使用 Xilinx SDK 在 ARM CortexA9 双核上实现高效(最大可能速度)线性代数?

我正在使用带有双核 Arm 处理器的 zybo z7 开发板,我想在 Xilinx SDK 上实现一个简单的神经网络,其中一个卷积层后跟一个密集层。具体来说,在 Arm 上传输基于 python numpy 的模型。我阅读了一些 ARM 和 SIMD 库的手册,但我不想深入研究。

对我来说,一个简单的方法是使用库并像 python 中的 numpy 一样自己(快速)执行乘法/点积/卷积等,并避免纯 for...loop 语法。举个例子就好了!

感谢您的宝贵时间

【问题讨论】:

  • 如果您要求推荐图书馆,您应该在其他地方询问。

标签: c arm linear-algebra xilinx zynq


【解决方案1】:

您可以尝试使用TensorFlow使用的Eigen库来实现矩阵计算,或者您甚至可以尝试使用已经在ARM-Cortex M系列处理器上测试过的TensorFlow lite

【讨论】:

  • 非常感谢!它适用于高性能
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-10-21
  • 2014-02-25
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多