【发布时间】:2015-06-08 22:40:59
【问题描述】:
我已经搜索了这个问题的答案,但没有找到任何可以直接帮助我的东西。
我正在使用 MKL 中包含的并行 FFT 库为非线性 PDE 开发 3D 数值积分器。
我的数组由 2^30 个数据点组成,比缓存大得多。这会导致约 50% 的缓存引用未命中,这似乎会增加大量访问内存的开销。
有什么聪明的方法可以解决这个问题吗?使用这么大的数组是否预计会有 50% 的缓存未命中?
任何帮助将不胜感激。
谢谢,
迪伦
【问题讨论】:
-
抱歉,50% 的缓存引用未命中。我将编辑原始帖子以反映这一点
标签: c++ optimization fft cpu-cache intel-mkl