【问题标题】:LLVM opt mem2reg has no effectLLVM opt mem2reg 没有效果
【发布时间】:2018-03-12 19:59:53
【问题描述】:

我目前正在使用 LLVM,并且正在尝试编写一些优化器来熟悉 opt 和 clang。我写了一个 test.c 文件如下:

int foo(int aa, int bb, int cc){
    int sum = aa + bb;
    return sum/cc;
}

我编译了源代码并生成了 2 个 .ll 文件,一个未优化,一个带有 mem2reg 优化器通道:

clang -emit-llvm -O0 -c test.c -o test.bc
llvm-dis test.bc
opt -mem2reg -S test.ll -o test-mem2reg.ll

两个 .ll 文件都给了我以下输出:

ModuleID = 'test.bc'
source_filename = "test.c"
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-unknown-linux-gnu"

; Function Attrs: noinline nounwind optnone uwtable
define i32 @foo(i32 %aa, i32 %bb, i32 %cc) #0 {
entry:
  %aa.addr = alloca i32, align 4
  %bb.addr = alloca i32, align 4
  %cc.addr = alloca i32, align 4
  %sum = alloca i32, align 4
  store i32 %aa, i32* %aa.addr, align 4
  store i32 %bb, i32* %bb.addr, align 4
  store i32 %cc, i32* %cc.addr, align 4
  %0 = load i32, i32* %aa.addr, align 4
  %1 = load i32, i32* %bb.addr, align 4
  %add = add nsw i32 %0, %1
  store i32 %add, i32* %sum, align 4
  %2 = load i32, i32* %sum, align 4
  %3 = load i32, i32* %cc.addr, align 4
  %div = sdiv i32 %2, %3
  ret i32 %div
}

attributes #0 = { noinline nounwind optnone uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }

!llvm.module.flags = !{!0}
!llvm.ident = !{!1}

!0 = !{i32 1, !"wchar_size", i32 4}
!1 = !{!"clang version 6.0.0 (trunk 314616)"}

看来我的 mem2reg 通行证不起作用!会有什么问题?

【问题讨论】:

    标签: optimization clang compiler-optimization ssa llvm-codegen


    【解决方案1】:

    另一个答案已经指出,使用-O0(或没有-O 选项),您的函数将使用optnone 属性进行注释。降低优化级别的另一个影响是似乎没有生成 TBAA 元数据,这也影响了以后的优化。

    所以要为opt准备一个文件,我发现最好保持你的优化级别,并通过选项-Xclang -disable-llvm-passes(该选项的帮助文本为“与-emit-llvm一起使用以获得通过根本不运行任何 LLVM 通道从前端获得原始 LLVM IR")。

    完整的调用变成:

    clang -S -emit-llvm -O -Xclang -disable-llvm-passes source.c
    

    【讨论】:

      【解决方案2】:

      最近,当使用 -O0 编译时,clang 开始为每个函数添加optnone 属性,这阻止了之后的进一步优化,包括mem2reg pass。为防止这种情况发生,请将 -Xclang -disable-O0-optnone 添加到 clang。

      【讨论】:

      • 谢谢。这个答案解决了我的问题。
      猜你喜欢
      • 1970-01-01
      • 2020-07-14
      • 1970-01-01
      • 2023-04-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-11-19
      • 2020-09-06
      相关资源
      最近更新 更多