JVM相关整理（一）--基本原理

一、Java代码运行流程

在初学Java 语言时，我们最初编译执行一个Java 程序是通过dos窗口，执行javac <options><source file>命令将.java文件编译成.class文件（Java字节码文件），然后通过java <source file>命令运行Java程序。其实现如图：

JVM相关整理（一）--基本原理

Java程序经过一次编译后，将Java代码编译为字节码，然后在不同操作系统上依靠不同的JVM进行解释，最后再转换为不同平台的机器码，最终得到执行。

一个普通Java 程序的具体执行流程，参考https://www.cnblogs.com/leefreeman/p/7344460.html：

public class HelloWord { public static void main(String[] args) { System.out.println("Hello world!"); } }

以上程序从编译到运行，如图：

JVM相关整理（一）--基本原理

二、什么是JVM

JVM(Java Virtual Machine)，即Java虚拟机，用来模拟通用的物理机。由于JVM能够将Java 字节码解释成平台的机器指令，所以JVM实现了Java语言的跨平台性。另，JDK、JRE、JVM之间的关系：JDK包含JRE，JRE包含JVM。

二、JVM基本结构

JVM相关整理（一）--基本原理

三、JVM内存空间

方法区

在Sun JDK中这块区域对应PermanetGeneration，即持久代。

方法区中存储每个类的信息：

Classloader 引用
运行时常量池
- 数值型常量
- 字段引用
- 方法引用
- 属性
字段数据
- 针对每个字段的信息
  - 字段名
  - 类型
  - 修饰符
  - 属性（Attribute）
方法数据
- 每个方法
  - 方法名
  - 返回值类型
  - 参数类型（按顺序）
  - 修饰符
  - 属性
方法代码
- 每个方法
  - 字节码
  - 操作数栈大小
  - 局部变量大小
  - 局部变量表
  - 异常表
  - 每个异常处理器
  - 开始点
  - 结束点
  - 异常处理代码的程序计数器（PC）偏移量
  - 被捕获的异常类对应的常量池下标

堆

堆被用来存储对象实例以及数组，可以认为Java中所有通过new 创建的对象的内存都在此分配。

由于堆是JVM中所有线程共享的，因此在其上进行对象内存的分配均需要进行加锁，这也导致了new 对象的开销比较大。

Sun Hotspot JVM 为了提高对象内存的分配效率，对于所创建的线程都会分配一块独立的空间TLAB(Thread Local Allocation Buffer)，其大小由JVM根据运行的情况计算而得，在TLAB上分配对象时不需要加锁，因此JVM在给线程的对象分配内存时会尽量的在TLAB 上分配，在这种情况下JVM中分配对象内存的性能和C基本是一样高效的，但如果对象过大的话则仍然是直接使用堆空间分配。

栈

Java 栈是一块线程私有的内存空间，以栈帧为单位，执行进栈跟出栈操作(FILO)。

每个帧代表一个方法，Java 方法有两种返回方式，return 和抛出异常，两种方式都会导致该方法对应的帧出栈和释放内存。

帧组成：局部变量表、操作数栈、帧数据区。

PC寄存器

每一个线程都有它自己的PC寄存器，也是该线程启动时创建的。PC寄存器的内容总是指向下一条将被执行指令的饿地址，这里的地址可以是一个本地指针，也可以是在方法区中相对应于该方法起始指令的偏移量。

若thread执行Java方法，则PC保存下一条执行指令的地址。若thread执行native方法，则PC的值为undefined。

本地方法栈

依赖于本地方法的实现，如某个JVM实现的本地方法接口使用C连接模型，则本地方法栈就是C栈，可以说某线程在调用本地方法时，就进入了一个不受JVM限制的领域，也就是JVM可以利用本地方法来动态扩展本身。

本地方法一般来说可以（依赖JVM的实现）反过来调用JVM中的Java 方法。这种native方法调用 Java 会发生在栈（一般是Java栈）上；线程将离开本地方法栈，并在Java栈上开辟一个新的栈帧。

注：

1）线程共享：堆、方法区；

2）线程私有：栈、PC寄存器；

3）栈帧只存储指向堆中对象或数组的引用，与局部变量数组（每个栈帧中的）中的原始类型和引用类型不同，对象总是存储在堆上以便在方法结束时不会被移除。对象只能由垃圾回收器移除；