【问题标题】:Should multiplication/bitshift optimization be visible in java bytecode乘法/位移优化是否应该在 Java 字节码中可见
【发布时间】:2016-06-27 09:48:32
【问题描述】:

我一直在读到不需要移位,因为编译器优化会将乘法转换为移位。如Should I bit-shift to divide by 2 in Java?Is shifting bits faster than multiplying and dividing in Java? .NET?

我不是在这里询问性能差异,我可以自己测试一下。但我觉得奇怪的是,有几个人提到它会“编译成同一个东西”。这似乎不是真的。我写了一小段代码。

private static void multi()
{
    int a = 3;
    int b = a * 2;
    System.out.println(b);
}

private static void shift()
{
    int a = 3;
    int b = a << 1L;
    System.out.println(b);
}

这给出了相同的结果,只是打印出来。

当我查看生成的 Java Bytecode 时,如下所示。

private static void multi();
Code:
   0: iconst_3
   1: istore_0
   2: iload_0
   3: iconst_2
   4: imul
   5: istore_1
   6: getstatic     #4                  // Field java/lang/System.out:Ljava/io/PrintStream;
   9: iload_1
  10: invokevirtual #5                  // Method java/io/PrintStream.println:(I)V
  13: return

private static void shift();
Code:
   0: iconst_3
   1: istore_0
   2: iload_0
   3: iconst_1
   4: ishl
   5: istore_1
   6: getstatic     #4                  // Field java/lang/System.out:Ljava/io/PrintStream;
   9: iload_1
  10: invokevirtual #5                  // Method java/io/PrintStream.println:(I)V
  13: return

现在我们可以看到“imul”和“ishl”之间的区别了。

我的问题是:显然,Java 字节码中看不到所说的优化。我仍然假设优化确实发生了,那么它只是发生在较低级别吗?或者,因为它是 Java,JVM 在遇到 imul 语句时是否知道它应该被翻译成别的东西。如果是这样,任何有关如何处理的资源将不胜感激非常

(作为旁注,我并不是要证明移位的必要性。我认为它会降低可读性,至少对于习惯于 Java 的人来说,对于 C++ 可能会有所不同。我只是想看看优化发生在哪里)。

【问题讨论】:

  • 字节码将被转换为机器码以供 JIT 执行,该转换将优化差异(并且它们将执行相同)。
  • “优化”可能发生在 JVM 级别,因为它是为 c/c++ 中的目标架构编写的;但正如你所发现的 - 它并不完全相同。从语法上讲,左移与乘以 2 相同,但从语义上讲,它是两条不同的指令。机器代码解释器可能会将它们转换为相同的东西,但不能保证,如果不深入 JVM 代码,肯定不会很明显。

标签: java compilation bytecode


【解决方案1】:

标题中的问题听起来与文本中的问题有点不同。引用的语句将移位和乘法“编译为相同的东西” 是正确的。但它还不适用于字节码。

一般来说,Java 字节码是相当未经优化的。 非常很少进行优化 - 主要是常量的内联。除此之外,Java 字节码只是原始程序的中间表示。并且从 Java 到 Java 字节码的翻译是相当“字面上”完成的。

(我认为这是一件好事。字节码仍然与原始 Java 代码非常相似。所有可能的细节(特定于平台!)优化都留给了虚拟机,它这里有更多选择。

所有进一步的优化,例如算术优化、死代码消除或方法内联,都由 JIT(即时编译器)在运行时完成。 Just-In-Time 编译器还应用了通过位移替换乘法的优化。

由于几个原因,您提供的示例使显示效果有点困难。由于内联和调用此方法的一般先决条件,方法中包含System.out.println 的事实往往会使实际机器代码变大。但更重要的是,移位 1 对应于与 2 的乘法,也对应于将值与自身相加。因此,您可能会在 multi- 和 shift 方法中看到伪装的 add 指令,而不是观察 multi 方法生成的机器代码中的 shl(左移)汇编指令.

但是,这里有一个非常实用的例子,它左移了 8,对应于乘以 256:

class BitShiftOptimization
{
    public static void main(String args[])
    {
        int blackHole = 0;
        for (int i=0; i<1000000; i++)
        {
            blackHole += testMulti(i);
            blackHole += testShift(i);
        }
        System.out.println(blackHole);

    }

    public static int testMulti(int a)
    {
        int b = a * 256;
        return b;
    }

    public static int testShift(int a)
    {
        int b = a << 8L;
        return b;
    }
}

(它接收要移动的值作为参数,以防止将其优化为常量。它多次调用方法,以触发 JIT。它返回并收集两个方法的值以防止方法调用要优化掉。再说一次,这很实用,但足以显示效果)

使用

在 Hotspot Disassembler VM 中运行它
java -server -XX:+UnlockDiagnosticVMOptions -XX:+TraceClassLoading -XX:+LogCompilation -XX:+PrintInlining -XX:+PrintAssembly BitShiftOptimization

将为testMulti 方法生成以下汇编代码:

Decoding compiled method 0x000000000286fbd0:
Code:
[Entry Point]
[Verified Entry Point]
[Constants]
  # {method} {0x000000001c0003b0} &apos;testMulti&apos; &apos;(I)I&apos; in &apos;BitShiftOptimization&apos;
  # parm0:    rdx       = int
  #           [sp+0x40]  (sp of caller)
  0x000000000286fd20: mov    %eax,-0x6000(%rsp)
  0x000000000286fd27: push   %rbp
  0x000000000286fd28: sub    $0x30,%rsp
  0x000000000286fd2c: movabs $0x1c0005a8,%rax   ;   {metadata(method data for {method} {0x000000001c0003b0} &apos;testMulti&apos; &apos;(I)I&apos; in &apos;BitShiftOptimization&apos;)}
  0x000000000286fd36: mov    0xdc(%rax),%esi
  0x000000000286fd3c: add    $0x8,%esi
  0x000000000286fd3f: mov    %esi,0xdc(%rax)
  0x000000000286fd45: movabs $0x1c0003a8,%rax   ;   {metadata({method} {0x000000001c0003b0} &apos;testMulti&apos; &apos;(I)I&apos; in &apos;BitShiftOptimization&apos;)}
  0x000000000286fd4f: and    $0x1ff8,%esi
  0x000000000286fd55: cmp    $0x0,%esi
  0x000000000286fd58: je     0x000000000286fd70  ;*iload_0
                        ; - BitShiftOptimization::testMulti@0 (line 17)

  0x000000000286fd5e: shl    $0x8,%edx
  0x000000000286fd61: mov    %rdx,%rax
  0x000000000286fd64: add    $0x30,%rsp
  0x000000000286fd68: pop    %rbp
  0x000000000286fd69: test   %eax,-0x273fc6f(%rip)        # 0x0000000000130100
                        ;   {poll_return}
  0x000000000286fd6f: retq   
  0x000000000286fd70: mov    %rax,0x8(%rsp)
  0x000000000286fd75: movq   $0xffffffffffffffff,(%rsp)
  0x000000000286fd7d: callq  0x000000000285f160  ; OopMap{off=98}
                        ;*synchronization entry
                        ; - BitShiftOptimization::testMulti@-1 (line 17)
                        ;   {runtime_call}
  0x000000000286fd82: jmp    0x000000000286fd5e
  0x000000000286fd84: nop
  0x000000000286fd85: nop
  0x000000000286fd86: mov    0x2a8(%r15),%rax
  0x000000000286fd8d: movabs $0x0,%r10
  0x000000000286fd97: mov    %r10,0x2a8(%r15)
  0x000000000286fd9e: movabs $0x0,%r10
  0x000000000286fda8: mov    %r10,0x2b0(%r15)
  0x000000000286fdaf: add    $0x30,%rsp
  0x000000000286fdb3: pop    %rbp
  0x000000000286fdb4: jmpq   0x0000000002859420  ;   {runtime_call}
  0x000000000286fdb9: hlt    
  0x000000000286fdba: hlt    
  0x000000000286fdbb: hlt    
  0x000000000286fdbc: hlt    
  0x000000000286fdbd: hlt    
  0x000000000286fdbe: hlt    

(顺便说一下,testShift 方法的代码有相同的说明)。

这里的相关行是

  0x000000000286fd5e: shl    $0x8,%edx

对应于左移8。

【讨论】:

  • 谢谢你,Marco,这是一个很好的答案,正是我想知道的。请问你用的是哪个反汇编VM?我会非常有兴趣自己玩这个。 :-)
  • 请注意,不优化字节码也会使调试变得容易得多。
  • @DylanMeeus 为了使用这个反汇编功能,您只需要将hsdis-amd64.dll(或.so.dylib 对于Linux 或Mac)扔到jre/bin/server 目录中。自己编译有点麻烦,但你可以在网上找到预编译的版本(我从this site 拿了一个,但没有保修...)
  • @Antimony 可能是真的,但是异常处理(以及如何检测错误条件以及如何从优化的机器代码进入 JVM)仍然涉及很多黑魔法。我可以将汇编代码的某些部分识别为“与此相关”,但远未了解内部发生的情况。
  • 我认为,应该强调优化的平台特定性,而不是用小写字母打印。如果 Java(源代码到字节代码)编译器曾经进行过优化,他们会努力压缩代码,因为这是唯一的通用优化,可以节省磁盘空间和加载时间。对目标 CPU 更有效的方法在编译时是不可预测的。对于问题的代码,用常量结果替换整个算术的可能性更大。这个答案的代码甚至可能发生这种情况,尽管它需要积极优化 JVM 和更长的运行时间……
猜你喜欢
  • 2016-07-01
  • 1970-01-01
  • 2015-12-25
  • 2020-06-29
  • 1970-01-01
  • 2013-09-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多