详解如何运行Java程序

2020-06-12

VM也就是Java虚拟机，它的内存结构这块知识点。

你说它重要吧，编写代码基本用不到它；

你说它不重要吧，程序员想要进阶又必须对底层有一定的了解。

最终还是决定更加深入地学习下JVM，同时也用自己的理解详细地说明Java程序是如何运行的。

当然本人目前的能力有限，只能说尽己之能学的越多越好。

一、Java程序开发三步骤

编写、编译和运行，图解如下：

①编写阶段

后缀名为.Java的文件，也就是所谓的源码。

但是Java虚拟机它并不认识.Java文件，Java虚拟机和Java语言其实并没有必然的联系。

其实我挺想吐槽的，你们长的这么像，竟然不认识？

那为何不认识呢？

按照我个人的理解，我们常说的代码、Java语言，其实本质上还是人类定义的一门语言，主要由英文组成，Java虚拟机本身并不认识它。

所以需要将其编译成Java虚拟机认识的语言，即.class文件。

②编译阶段

后缀名为.class的文件，也就是所谓的字节码文件。

字节码文件，就可以理解成我们写代码一个类（接口、枚举、注释）里面的所有数据。

.class文件是如何来的？

javac编译器编译而来的，它能将.java文件编译成.class文件，这样的话JVM也就能认识.class文件了。

我们平时写的代码其实也是Java源码，只不过开发工具很强大，将这三个阶段糅合在一起了，以IDEA工具为例：

src，其实就是源码的意思，我们平时编写的类、接口、枚举、注解等文件，其实本质上就是.java文件。

利用开发工具中的Show in Explorer功能，可以找到计算机里对应的文件夹文件。

out，这个我还不太懂具体是什么意思，但是.class文件就在这个文件夹里面。

如果不用开发工具，我们需要用javac编译器将.java文件编译成.class文件；

开发工具等于是自动帮我们编译了，非常的方便，但是原理我们要明白。

既然讲到了.class文件，再回顾下反射中刚学的Class对象：

Class本身也是Java里的一个类，它其实就是指的字节码文件。

注意：小写字母开头的class是Java里的一个关键字，创建一个类时类名前面都会由它来修饰。

所以Class类也就表示成：class Class{}；

前面是关键字，后面是类名。

最后用一个例子来说明：

我们在开发工具里面编写一个Student类；

那么在对应的文件夹下就会有一个Student.java文件，也就是源码；同时开发工具会给我编译一个对应的Student.class文件，也就是字节码文件；

而这个字节码文件会有唯一的一个Class对象，专门用来描述该字节码文件，在反射中可以拿来使用，除此之外还可以作为线程锁。

③运行阶段

Java虚拟机是认识.class文件的，也就是说能够用来运行程序了。

但它具体是如何运行的呢？

就需要知道JDK了，图解如下：

①JRE：Java Runtime Environment

翻译过来就是Java运行环境，包含JVM和运行时所需要的核心类库。

也就是说有了JRE就可以运行Java程序了，但是只能用来运行，如果出了bug，是没法修改的，所以需要JDK。

②JDK：Java Development Kit

翻译过来就是Java程序开发工具包，包含JRE 和开发人员使用的工具。

前面提到的javac编译器就是Java工具，JRE中是没有javac编译器的，所以它没法修改程序，毕竟没有编译的话JVM是不认识的。

Java虚拟机是认识字节码文件的，并且本质上它就是一个字节码翻译器。

它可以将字节码文件翻译成各个系统（Windows系统、Mac系统、linux系统）对应的机器码；

这样的话就能确保字节码文件能在各个系统上正确运行。

这也就是Java所谓的跨平台特性的由来。

接下来我们就详细地了解下Java虚拟机。

二、JVM内存结构

我们看oracle最新的官方文档，最权威的便是这个官方文档，毕竟技术是不断更新的：

JVM内存主要分为这五大块：

程序计数器（The pc Register）
Java虚拟机栈(Stacks)
堆内存（Heap）
方法区（Method Area）
本地方法栈（Native Method Stacks）

其中官方文档中还有一个运行时常量池，暂且不考虑。

①stack栈

我们常说的栈内存，其实严格上来说应该叫Java虚拟机栈。

利用开发工具IDEA断点调试，我们可以很清晰地看到方法进栈出栈的过程。

这是一段非常简易的代码：main方法里面调用method1方法，method1方法里面调用method2方法。

利用右上角两个功能键，可以一步一步了解方法进栈出栈的过程。

Frames，翻译过来就是帧的意思，一个方法对应一个栈帧。

什么叫帧？

在影像动画里，一个镜头就是一帧；那么栈帧就可以理解成方法进栈的那一刻，就会形成一个栈帧。

每个方法进栈都会有一个对应的栈帧。

此外、栈是先进先出原则，mian方法在最底下，最先进来，最后出去。

这个过程可以用断点调试模拟出来，感兴趣的小伙伴可以去尝试下。

其中方法栈里的线程是不共享的，什么意思呢？

最直接地理解就是：栈里面，不同的线程是独立存在的，所以线程安全。

与之相对的是堆、方法区线程是共享的，这又是什么意思呢？

最直接地理解就是：堆、方法区里面的数据，不同的线程都可以拿过去用，所以线程不安全。

②heep：堆

我们看oracle最新的官方文档对其的说明，最权威的便是这个官方文档，毕竟技术是不断更新的：

这是翻译成中文后的页面，原文都是英文，英语好的小伙伴可以直接看，不过翻译大体上也还算是准确的：

堆的线程是共享的（数据共享）
堆的区域是用来存放对象和数组的（new 对象 new 数组，看到new这个关键字就可以想到堆）
堆在Java虚拟机启动时创建。
堆的大小可以是固定的，也可以扩展：使用“-Xms”与“-Xmx”控制堆的最小与最大内存。

此外对象是会创建很多的，其中一小部分会一直被使用到，大部分我们使用后就会舍弃，所以这也是垃圾收集器管理的主要区域。

根据这两种不同的情况，垃圾收集器为了更好地一一应对，堆内存又被划分成新生代和老年代：

老年代：对象会一直被使用到，不会轻易地被回收
新生代：对象朝生夕灭，需要经常回收

其中还有更加详细地细分，实在是有点学不动了，暂时不考虑。

③方法区

同样的，看官方文档：

这个翻译有点问题，但大体上也能看：

方法区的线程是共享的。
方法区在Java虚拟机启动时创建。
方法区的作用是存储每个类的结构。

既然是存储类的结构，那么.class文件也就是存储在这个内存区域。

说白了就是类里面的数据，都是存在这个方法区里面的。

类中有什么？

成员变量，成员方法等等，其中方法和变量还分静态和非静态。

这些都是存储在方法区里面的，除了类里的数据，常量池也在方法区里面。

方法运行时，会从方法区进入到栈里面；

创建该类的对象时，会将创建的对象存放在堆里面。

其中静态变量随着类的加载而加载，它并不会进堆。

以上三块便是和我们编写Java代码息息相关的内存区域，除此之外还有两块区域：

④程序计数器

我们平时编写的代码可以被反编译成JVM指令，cpu就是依靠这个程序计数器执行指令的：

程序计数器会保存当前执行指令的地址，比如说程序计数器现在保存的为0，那么CPU会执行0对应的指令；

一旦指令执行，程序计数器将更新到下一条指令，上图中也就是3，CPU接着会执行3对应的指令。

就这样依次执行下去，程序计数器的作用就在于保证程序能正常运行。

⑤本地方法栈

①中的栈准确地说应该叫虚拟机栈，它服务的方法是Java方法；

本地方法栈作用和其是差不多的，不同的地方在于它服务的方法不是Java方法而是本地方法；

什么叫本地方法？我们其实见过，如下图：

Objcet类中就有本地方法，被native这个关键字修饰，native就是本地的意思，这很好记忆。

也就是说该方法不是由Java语言写的，而是由本地语言写的，比如说C语言。

当然虚拟机规范中并未给出强制规定由什么本地语言写，不同的虚拟机可以自由实现。

以上便是对JVM内存结的说明，除了JVM内存结构外，还有两大块……

三、JVM体系结构

源码通过编译成字节码文件，再被类加载器加载进内存，最后经过各种交互被执行，大致就是这么一个运行流程：

①类加载子系统(Class loader SubSystem)

它的作用是将类加载进内存，在Java中对应一个类ClassLoader，该类是一个抽象类。

引导类加载器（Bootstrap ClassLoader）

它是由C++编写的，是用来引导Java程序的，它并不是ClassLoader子类。

扩展类加载器（Extension ClassLoader）

它是由Java程序编写的，负责加载java平台中扩展功能的一些jar包。

应用类加载器：（Application ClassLoader）

它是由Java程序编写的，加载编写的代码。

②运行时数据区(Runtime Data Areas)

也就是JVM内存结构，上述已经详细讲解了，这也是对于程序员来说需要去重点了解的。

③执行引擎(Execution Engine)

解释器interpreter：它是用于读取字节码文件，对其解释并逐一执行，它的解释速度较快，但是执行较慢，并且它有一个致命的缺点，就是当同一个方法被多次调用时，它每次都要解释。

即时编译器JIT Compiler：它是用来优化解释器的，解决上述的缺点。

垃圾回收器GC：收集并回收由new关键字创建的对象。

④本地方法接口和本地方法库

存放本地方法。

总结：

以上便是对Java程序运行的详解，以及对JVM内存的分析。

奈何本人能力实在是有限，还有一些地方法没有弄明白，讲解的也不算很深入，但就我当前具备的能力而言，已经算是最详细的解读了。

网站资讯

阅读原文

下一篇：微众开源数据交换平台可跨多数据源实现传递共享

上一篇：程序员真香定律：源码即设计

写评论...