【发布时间】:2020-05-14 19:14:39
【问题描述】:
我已经优化了我的编译器以生成更小的代码。然而,尽管生成的指令更少,代码路径更短,尤其是加载和存储更少,但为小型演示程序生成的代码运行速度更慢。
我怀疑问题是“加载命中存储”。我应该如何检查这个?显而易见的答案是配置文件。阅读了各种 AIX 文档后,答案似乎是使用 tprof 并带有指示“加载命中存储”的适当事件。类似的东西
tprof -a -usek -E PM_CMPLU_STALL_REJECT -y my_benchmark_program
但是 - 这会给出错误消息
A group with events PM_CMPLU_STALL_REJECT and PM_INST_CMPL cannot be found.
tprof 文档确实提到所选事件必须与 PM_INST_CMPL 位于同一组中。但是 - 它没有说明还可以做什么。
那么 - 我如何测试我的理论,即“加载命中存储”是性能下降的原因?
【问题讨论】:
标签: performance profiling aix powerpc