vtune需要运行在intel处理器的电脑上,在AMD上好像只能使用callgraph。

调试时需要有源代码或者相应的PDB文件:

pdb生成办法:打开/Zi /debug生产pdb文件,PBD只需和运行程序放在同一目录即可。

分析完后,默认是按照CPU_CLK_UNHALTED排序的。

需要关注的内容:

Event based sampling :测程序执行中处理器的内部事件(Performance Monitor Unit:PMU)发生次数(及样本)。

Sample After Value (SAV):当事件达到一定的累积,去获得一个样本. SAV就是一个事件的设定值.如,CPU得主频是2G Hz, 每秒得到1000个样本,SAV=2,000,000,000/1000 = 2,000,000

INST_RETIRED.ANY : 表示指令的有效执行的计数

CPU_CLK_UNHALTED.CORE: 表示非停机状态花费的机器周期

CPI = CPU_CLK_UNHALTED.CORE / INST_RETIRE.ANY, 表示一段代码(函数,模块)平均每条指令花费的机器周期.自然是愈小愈好.

——CPU_CLK_UNHALTED.CORE大的函数,且CPI也大的函数,去关注(通常称之为热点函数).


相关文章:

  • 2021-07-12
  • 2021-08-20
  • 2021-12-12
  • 2021-12-26
  • 2021-09-09
猜你喜欢
  • 2021-10-26
  • 2021-07-28
  • 2021-11-13
  • 2022-01-20
  • 2022-12-23
  • 2021-05-26
  • 2021-06-19
相关资源
相似解决方案