字节码指令集

1、概述

  • Java字节码对于虚拟机,就好像汇编语言对于计算机,属于基本执行指令。
  • Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数,Operands)而构成。由于Java虚拟机采用面向操作数栈而不是寄存器的结构,所以大多数的指令都不包含操作数,只有一个操作码。
  • 由于限制了Java虚拟机操作码的长度为一个字节(即0~255),这意味着指令集的操作码总数不可能超过256条。官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html
  • 熟悉虚拟机的指令对于动态字节码生成、反编译Class文件、Class文件修补都有着非常重要的价值。因此,阅读字节码作为了解Java虚拟机的基础技能,需要熟练掌握常见指令。

1.1 执行模型

  • 如果不考虑异常处理的话,那么Java虚拟机的解释器可以使用下面这个伪代码当做最基本的执行模型来理解

    1
    2
    3
    4
    5
    6
    do{
    自动计算PC寄存器的值加1;
    根据PC寄存器的指示位置,从字节码流中取出操作码;
    if(字节码存在操作数)从字节码流中取出操作数;
    执行操作码所定义的操作;
    }while(字节码长度>0);

1.2 字节码与数据类型

  • 在Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。例如,iload指令用于从局部变量表中加载int型的数据到操作数栈中,而fload指令加载的则是float类型的数据。
  • 对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务:
    • i代表对int类型的数据操作。
    • l代表long。
    • s代表short。
    • b代表byte。
    • c代表char。
    • f代表float。
    • d代表double。
  • 也有一些指令的助记符中没有明确地指明操作类型的字母,如arraylength指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象。
  • 还有另外一些指令,如无条件跳转指令goto则是与数据类型无关的。
  • 大部分的指令都没有支持整数类型byte、char和short,甚至没有任何指令支持boolean类型。编译器会在编译期或运行期将byte和short类型的数据带符号扩展(Sign-Extend)为相应的int类型数据,将boolean和char类型数据零位扩展(Zero-Extend)为相应的int类型数据。与之类似,在处理boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。因此,大多数对于boolean、byte、short和char类型数据的操作,实际上都是使用相应的int类型作为运算类型。

1.3 指令分类

  • JVM中的字节码指令集按用途大致分成9类:
    • 加载与存储指令
    • 算术指令
    • 类型转换指令
    • 对象的创建与访问指令
    • 方法调用与返回指令
    • 操作数栈管理指令
    • 比较控制指令
    • 异常处理指令
    • 同步控制指令
  • 一个指令,可以从局部变量表、常量池、堆中对象、方法调用、系统调用中等取得数据,这些数据(可能是值,可能是对象的引用)被压入操作数栈。
  • 一个指令,也可以从操作数栈中取出一到多个值(pop多次),完成赋值、加减乘除、方法传参、系统调用等等操作。

2、加载与存储指令

  • 作用:加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递。
  • 常用指令
    • 【局部变量压栈指令】将一个局部变量加载到操作数栈:xload、xload_(其中x为i、1、f、d、a,n为0到3)
    • 【常量入栈指令】将一个量加载到操作数栈:bipush、sipush、ldc、1dc_w、ldc2_w、aconst_null、iconst_ml、iconst_、lconst_、fconst_、dconst_
    • 【出栈装入局部变量表指令】将一个数值从操作数栈存储到局部变量表:xstore、xstore_(其中x为i、l、f、d、a,n为0到3);xastore(其中x为i、l、f、d、a、b、c、s)。
    • 扩充局部变量表的访问索引的指令:wide。
  • 上面所列举的指令助记符中,有一部分是以尖括号结尾的(例如iload_)。这些指令助记符实际上代表了一组指令(例如iload_代表了iload_0、iload_1、iload_2和iload_3这几个指令)。这几组指令都是某个带有一个操作数的通用指令(例如iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中。
  • 除此之外,它们的语义与原生的通用指令完全一致(例如iload_0的语义与操作数为0时的iload指令语义完全一致)。在尖括号之间的字母指定了指令隐含操作数的数据类型,代表非负的整数,代表是int类型数据,代表long类型,代表float类型,代表double类型。操作byte、char、short和boolean型数据时,经常用int类型的指令来表示。

2.1 操作数栈和局部变量表

  • 操作数栈
    • Java字节码是Java虚拟机所使用的指令集。因此,它与Java虚拟机基于栈的计算模型是密不可分的。在解释执行过程中,每当为Java方法分配栈桢时,Java虚拟机往往需要开辟一块额外的空间作为操作数栈,来存放计算的操作数以及返回结果。
    • 具体来说便是:执行每一条指令之前,Java虚拟机要求该指令的操作数已被压入操作数栈中。在执行指令时,Java虚拟机会将该指令所需的操作数弹出,并且将指令的结果重新压入栈中。
  • 局部变量表
    • Java方法栈桢的另外一个重要组成部分则是局部变量区,字节码程序可以将计算的结果缓存在局部变量区之中。实际上,Java虚拟机将局部变量区当成一个数组,依次存放this指针(仅非静态方法),所传入的参数,以及字节码中的局部变量。
    • 和操作数栈一样,long类型以及double类型的值将占据两个单元,其余类型仅占据一个单元。(一个slot占据4个字节)

2.2 局部变量压栈指令

  • 局部变量压栈指令将给定的局部变量表中的数据压入操作数栈。
  • 这类指令大体可以分为(说明:在这里,x的取值表示数据类型):
    • xload_(x为i、l、f、d、a,n为0到3)
    • xload(x为i、1、f、d、a)
  • 指令xload_n表示将第n个局部变量压入操作数栈,比如iload_1、fload_0、aload_0等指令。其中aload_n表示将一个对象引用压栈。
  • 指令xload通过指定参数的形式,把局部变量压入操作数栈,当使用这个命令时,表示局部变量的数量可能超过了4个,比如指令iload、fload等。

例子:

1
2
3
4
5
6
7
8
9
public class LoadAndStoreTest {
public void load(int num, Object obj,long count,boolean flag,short[] arr) {
System.out.println(num);
System.out.println(obj);
System.out.println(count);
System.out.println(flag);
System.out.println(arr);
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
 0 getstatic #2 <java/lang/System.out>
3 iload_1 //将num压入操作数栈
4 invokevirtual #3 <java/io/PrintStream.println>
7 getstatic #2 <java/lang/System.out>
10 aload_2 //将obj压入操作数栈
11 invokevirtual #4 <java/io/PrintStream.println>
14 getstatic #2 <java/lang/System.out>
17 lload_3 //将count压入操作数栈
18 invokevirtual #5 <java/io/PrintStream.println>
21 getstatic #2 <java/lang/System.out>
24 iload 5 //将flag压入操作数栈
26 invokevirtual #6 <java/io/PrintStream.println>
29 getstatic #2 <java/lang/System.out>
32 aload 6 //将arr压入操作数栈
34 invokevirtual #4 <java/io/PrintStream.println>
37 return

2.3 常量入栈指令

  • 常量入栈指令的功能是将常数压入操作数栈,根据数据类型和入栈内容的不同,又可以分为const系列、push系列和ldc指令。
    • 指令const系列:
      • 用于对特定的常量入栈,入栈的常量隐含在指令本身里。指令有:iconst_(i从-1到5)、lconst_(l从0到1)、fconst_(f从0到2)、dconst_(d从0到l)、aconst_null。
      • 比如:
        • iconst_m1:将-1压入操作数栈。
        • iconst_x(x为0到5)将x压入栈。
        • lconst_0、lconst_1分别将长整数0和1压入栈。
        • fconst_0、fconst_1、fconst_2分别将浮点数0、1、2压入栈。
        • dconst_0和dconst_1分别将double型0和1压入栈。
        • aconst_nu11将null压入操作数栈。
      • 从指令的命名上不难找出规律,指令助记符的第一个字符总是喜欢表示数据类型,i表示整数,1表示长整数,f表示浮点数,d表示双精度浮点,习惯上用a表示对象引用。如果指令隐含操作的参数,会以下划线形式给出。
    • 指令push系列:
      • 主要包括bipush和sipush。它们的区别在于接收数据类型的不同,bipush接收8位整数作为参数,sipush接收16位整数,它们都将参数压入栈。
    • 指令ldc系列:
      • 如果以上指令都不能满足需求,那么可以使用万能的ldc指令,它可以接收一个8位的参数,该参数指向常量池中的int、float或者string的索引,将指定的内容压入堆栈。
      • 类似的还有ldc_w,它接收两个8位参数,能支持的索引范围大于ldc。
      • 如果要压入的元素是long或者double类型的,则使用ldc2_w指令,使用方式都是类似的。
类型 常数指令 范围
int(boolean、byte、char、short) iconst [-1,5]
bipush [-128,127]
sipush [-32768,32767]
ldc any int value
long lconst 0,1
ldc any long value
float fconst 0,1,2
ldc any float value
double dconst 0,1
ldc any doublet value
reference aconst null
ldc String literal,Class literal

例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
public class LoadAndStoreTest {
public void pushConstLdc() {
int i = -1;
int a = 5;
int b = 6;
int c = 127;
int d = 128;
int e = 32767;
int f = 32768;

long a1 = 1;
long a2 = 2;
float b1 = 2;
float b2 = 3;
double c1 = 1;
double c2 = 2;
Date d1 = null;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
 0 iconst_m1 //将int类型常量-1压入栈
1 istore_1
2 iconst_5 //将int类型常量5压入栈
3 istore_2
4 bipush 6 //将一个8位带符号整数6压入栈
6 istore_3
7 bipush 127 //将一个8位带符号整数127压入栈
9 istore 4
11 sipush 128 //将一个16位带符号整数128压入栈
14 istore 5
16 sipush 32767 //将一个16位带符号整数32767压入栈
19 istore 6
21 ldc #2 <32768> //把常量池中的第2项(Integer类型的32768)压入栈
23 istore 7
25 lconst_1 将long类型常量1压入栈
26 lstore 8
28 ldc2_w #3 <2> 把常量池中的第3项(long类型的2)压入栈
31 lstore 10
33 fconst_2 将float类型常量2压入栈
34 fstore 12
36 ldc #5 <3.0> 把常量池中的第5项(float类型的3.0)压入栈
38 fstore 13
40 dconst_1 //将double类型常量0压入栈
41 dstore 14
43 ldc2_w #6 <2.0> 把常量池中的第6项(double类型的2.0)压入栈
46 dstore 16
48 aconst_null //将null对象引用压入栈
49 astore 18
51 return

2.4 出栈装入局部变量表指令

  • 出栈装入局部变量表指令用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定位置,用于给局部变量赋值。
  • 这类指令主要以store的形式存在,比如xstore(x为i、l、f、d、a)、xstore_n(x为i、l、f、d、a,n为0至3)。
    • 其中,指令istore_n将从操作数栈中弹出一个整数,并把它赋值给局部变量索引n位置。
    • 指令xstore由于没有隐含参数信息,故需要提供一个byte类型的参数类指定目标局部变量表的位置。
  • 一般说来,类似像store这样的命令需要带一个参数,用来指明将弹出的元素放在局部变量表的第几个位置。但是,为了尽可能压缩指令大小,使用专门的istore_1指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有istore_0、istore_2、istore_3,它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第0、2、3个位置。
  • 由于局部变量表前几个位置总是非常常用,因此这种做法虽然增加了指令数量,但是可以大大压缩生成的字节码的体积。如果局部变量表很大,需要存储的槽位大于3,那么可以使用istore指令,外加一个参数,用来表示需要存放的槽位位置。

例子:

1
2
3
4
5
6
7
8
9
public class LoadAndStoreTest {
public void store(int k, double d) {
int m = k + 2;
long l = 12;
String str = "perfectcode.top";
float f = 10.0F;
d = 10;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
 0 iload_1 //将局部变量表中索引为1的数k压入操作数栈
1 iconst_2 //将int类型常量2压入栈
2 iadd //先弹栈并进行加法运算后把结果重新压栈
3 istore 4 //将栈顶数据类型为int的值存入局部变量表索引4的位置
5 ldc2_w #2 <12> //把常量池中的第2项(long类型的12)压入栈
8 lstore 5 //将栈顶数据类型为long的值存入局部变量表索引5的位置
10 ldc #4 <perfectcode.top> //把常量池中的第4项(String类型的地址引用)压入栈
12 astore 7 //将栈顶数据类型为String的地址引用存入局部变量表索引7的位置
14 ldc #5 <10.0> //把常量池中的第5项(float类型的10.0)压入栈
16 fstore 8 //将栈顶数据类型为float的值存入局部变量表索引8的位置
18 ldc2_w #6 <10.0> //把常量池中的第6项(double类型的10.0)压入栈
21 dstore_2 //将栈顶数据类型为double的值存入局部变量表索引2的位置
22 return

3、算术指令

  • 作用:算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新压入操作数栈。
  • 大体上算术指令可以分为两种:对整型数据进行运算的指令与对浮点类型数据进行运算的指令。
  • byte、short、char和boolean类型说明
    • 在每一大类中,都有针对Java虚拟机具体数据类型的专用算术指令。但没有直接支持byte、short、char和boolean类型的算术指令,对于这些数据的运算,都使用int类型的指令来处理。此外,在处理boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。
  • 运算时的溢出
    • 数据运算可能会导致溢出,例如两个很大的正整数相加,结果可能是一个负数。其实Java虚拟机规范并无明确规定过整型数据溢出的具体结果,仅规定了在处理整型数据时,只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出异常ArithmeticException。
  • 运算模式
    • 向最接近数舍入模式:JVM要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的。
    • 向零舍入模式:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果。
  • NaN值使用
    • 当一个操作产生溢出时,将会使用有符号的无穷大表示,如果某个操作结果没有明确的数学定义的话,将会使用NaN值来表示。而且所有使用NaN值作为操作数的算术操作,结果都会返回NaN。

例子:

1
2
3
4
5
6
7
8
9
10
11
12
public class ArithmeticTest {
public static void main(String[] args) {
int i = 10;
double j = i / 0.0;
System.out.println(j);//Infinity:无穷大


double d1 = 0.0;
double d2 = d1 / 0.0;
System.out.println(d2);//NaN:not a number
}
}

3.1 所有算术指令

  • 加法指令:iadd、ladd、fadd、dadd
  • 减法指令:isub、lsub、fsub、dsub
  • 乘法指令:imul、lmul、fmul、dmul
  • 除法指令:idiv、ldiv、fdiv、ddiv
  • 求余指令:irem、lrem、frem、drem(remainder:余数)
  • 取反指令:ineg、lneg、fneg、dneg(negation:取反)
  • 自增指令:iinc
  • 位运算指令,又可分为:
    • 位移指令:ishl、ishr、iushr、lshl、lshr、lushr
    • 按位或指令:ior、lor
    • 按位与指令:iand、land
    • 按位异或指令:ixor、lxor
  • 比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp

例子1:

1
2
3
4
5
6
7
public class ArithmeticTest {
public static void main(String[] args) {
float i = 10;
float j = -i;
i = -j;
}
}
1
2
3
4
5
6
7
8
9
0 ldc #2 <10.0> //把常量池中的第2项(float类型的10.0)压入栈
2 fstore_1 //将栈顶数据类型为float的值存入局部变量表索引1的位置
3 fload_1 //将局部变量表中索引为1的数压入操作数栈
4 fneg //将操作数栈顶的数取出后进行取反后重新压栈
5 fstore_2 //将栈顶数据类型为float的值存入局部变量表索引2的位置
6 fload_2 //将局部变量表中索引为2的数压入操作数栈
7 fneg //将操作数栈顶的数取出后进行取反后重新压栈
8 fstore_1 //将栈顶数据类型为float的值存入局部变量表索引1的位置
9 return

例子2:

1
2
3
4
5
6
public class ArithmeticTest {
public static void main(String[] args) {
int i = 100;
i += 10;
}
}
1
2
3
4
0 bipush 100 //将一个8位带符号整数100压入栈
2 istore_1 //将栈顶数据类型为int的值存入局部变量表索引1的位置
3 iinc 1 by 10 //将局部变量表索引为1的值加上10
6 return

例子3:

1
2
3
4
5
6
7
public class ArithmeticTest {
public static void main(String[] args) {
int i = 10;
i++;
//++i;
}
}
1
2
3
4
0 bipush 10 //将10压栈
2 istore_1 //将栈顶数据存入局部变量表索引为1的位置
3 iinc 1 by 1 //局部变量表索引为1的值作自增操作
6 return

i++和++i在不涉及赋值操作时,字节码指令都是相同的,即效率没有区别。

例子4:

1
2
3
4
5
6
7
8
9
public class ArithmeticTest {
public static void main(String[] args) {
int i = 10;
int a = i++;

int j = 20;
int b = ++j;
}
}
1
2
3
4
5
6
7
8
9
10
11
 0 bipush 10 //将10压栈
2 istore_1 //将栈顶数据存入局部变量表索引为1的位置
3 iload_1 //将局部变量表索引为1的值压栈
4 iinc 1 by 1 //局部变量表索引为1的值作自增操作
7 istore_2 //将栈顶数据放进局部变量表索引为2的位置
8 bipush 20 //将20压栈
10 istore_3 //将栈顶数据放进局部变量表索引为3的位置
11 iinc 3 by 1 //局部变量表索引为3的值作自增操作
14 iload_3 //将局部变量表索引为3的值压栈
15 istore 4 //将栈顶数据放进局部变量表索引为4的位置
17 return

例子5:

1
2
3
4
5
6
7
public class ArithmeticTest {
public static void main(String[] args) {
int i = 10;
i = i++;
System.out.println(i);//10
}
}
1
2
3
4
5
6
7
8
9
 0 bipush 10 //将10压栈
2 istore_1 //将栈顶数据存入局部变量表索引为1的位置
3 iload_1 //将局部变量表索引为1的值压栈
4 iinc 1 by 1 //局部变量表索引为1的值作自增操作
7 istore_1 //将栈顶数据存入局部变量表索引为1的位置,此时局部变量表中索引为1的已经经过自增操作的值被覆盖,又变为原来的数
8 getstatic #2 <java/lang/System.out>
11 iload_1
12 invokevirtual #3 <java/io/PrintStream.println>
15 return

3.2 比较指令

  • 比较指令的作用是比较栈顶两个元素的大小,并将比较结果入栈。比较指令有:dcmpg,dcmpl、fcmpg、fcmpl、lcmp。
    • 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令。以float为例,有fcmpg和fcmpl两个指令,它们的区别在于在数字比较时,若遇到NaN值,处理结果不同。
    • 指令dcmpl和dcmpg也是类似的,根据其命名可以推测其含义,在此不再赘述。
    • 指令lcmp针对long型整数,由于long型整数没有NaN值,故无需准备两套指令。
  • 举例
    • 指令fcmpg和fcmpl都从栈中弹出两个操作数,并将它们做比较,设栈顶的元素为v2,栈顶顺位第2位的元素为v1,若v1=v2,则压入0;若v1>v2则压入1;若v1<v2则压入-1。两个指令的不同之处在于,如果遇到NaN值,fcmpg会压入1,而fcmp1会压入-1。

4、类型转换指令

  • 类型转换指令可以将两种不同的数值类型进行相互转换。
  • 这些转换操作一般用于实现用户代码中的显式类型转换操作,或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。

4.1 宽化类型转换

  • Java虚拟机直接支持以下数值的宽化类型转换(widening numeric conversion,小范围类型向大范围类型的安全转换)。也就是说,并不需要指令执行,包括:
    • 从int类型到long、float或者double类型。对应的指令为:i2l、i2f、i2d。
    • 从long类型到float、double类型。对应的指令为:l2f、l2d。
    • 从float类型到double类型。对应的指令为:f2d。
  • 简化为:int–>long–>float–>double

例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
public class ClassCastTest {
public static void main(String[] args) {
int i = 10;
long l = i;
float f = i;
double d = i;

float f1 = l;
double d1 = l;

double d2 = f1;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
 0 bipush 10
2 istore_1
3 iload_1
4 i2l
5 lstore_2
6 iload_1
7 i2f
8 fstore 4
10 iload_1
11 i2d
12 dstore 5
14 lload_2
15 l2f
16 fstore 7
18 lload_2
19 l2d
20 dstore 8
22 fload 7
24 f2d
25 dstore 10
27 return
  • 精度损失问题
    • 宽化类型转换是不会因为超过目标类型最大值而丢失信息的,例如,从int转换到1ong,或者从int转换到double,都不会丢失任何信息,转换前后的值是精确相等的。
    • 从int、long类型数值转换到float,或者long类型数值转换到double时,将可能发生精度丢失——可能丢失掉几个最低有效位上的值,转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数值。
    • 尽管宽化类型转换实际上是可能发生精度丢失的,但是这种转换永远不会导致Java虚拟机抛出运行时异常。

例子:

1
2
3
4
5
6
7
8
9
10
11
public class ClassCastTest {
public static void main(String[] args) {
int i = 123123123;
float f = i;
System.out.println(f);//1.2312312E8,发生精度损失

long l = 123123123123123123L;
double d = l;
System.out.println(d);//1.2312312312312312E17,发生精度损失
}
}
  • 从byte、char和short类型到int类型的宽化类型转换实际上是不存在的。对于byte类型转为int,虚拟机并没有做实质性的转化处理,只是简单地通过操作数栈交换了两个数据。而将byte转为long时,使用的是i2l,可以看到在内部byte在这里已经等同于int类型处理,类似的还有short类型,这种处理方式有两个特点:
    • 一方面可以减少实际的数据类型,如果为short和byte都准备一套指令,那么指令的数量就会大增,而虚拟机目前的设计上,只愿意使用一个字节表示指令,因此指令总数不能超过256个,为了节省指令资源,将short和byte当做int处理也在情理之中。
    • 另一方面,由于局部变量表中的槽位固定为32位,无论是byte或者short存入局部变量表,都会占用32位空间。从这个角度说,也没有必要特意区分这几种数据类型。

例子:

1
2
3
4
5
6
7
8
public class ClassCastTest {
public static void main(String[] args) {
byte b = 1;
int i = b;
long l = b;
double d = b;
}
}
1
2
3
4
5
6
7
8
9
10
11
 0 iconst_1
1 istore_1
2 iload_1
3 istore_2
4 iload_1
5 i2l
6 lstore_3
7 iload_1
8 i2d
9 dstore 5
11 return

4.2 窄化类型转换

  • Java虚拟机支持以下窄化类型转换:
    • 从int类型至byte、short或者char类型。对应的指令有:i2b、i2c、i2s。
    • 从long类型到int类型。对应的指令有:l2i。
    • 从float类型到int或者long类型。对应的指令有:f2i、f2l。
    • 从double类型到int、long或者float类型。对应的指令有:d2i、d2l、d2f。

例子:

1
2
3
4
5
6
7
8
9
10
11
12
public class ClassCastTest {
public static void main(String[] args) {
int i = 10;
byte b = (byte)i;
short s = (short)i;
char c = (char)i;

long l = 10L;
int i1 = (int)l;
byte b1 = (byte) l;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
 0 bipush 10
2 istore_1
3 iload_1
4 i2b
5 istore_2
6 iload_1
7 i2s
8 istore_3
9 iload_1
10 i2c
11 istore 4
13 ldc2_w #2 <10>
16 lstore 5
18 lload 5
20 l2i
21 istore 7
23 lload 5
25 l2i
26 i2b //由于没有l2b的指令,所以要通过l2i、i2b两个指令完成long到byte的转换。
27 istore 8
29 return
  • 精度损失问题
    • 窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级,因此,转换过程很可能会致数值丢失精度。
    • 尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况,但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常。

例子:

1
2
3
4
5
6
7
public class ClassCastTest {
public static void main(String[] args) {
int i = 128;
byte b = (byte)i;
System.out.println(b);//-128
}
}
  • 当将一个浮点值窄化转换为整数类型T(T限于int或long类型之一)的时候,将遵循以下转换规则:
    • 如果浮点值是NaN,那转换结果就是int或long类型的0。
    • 如果浮点值不是无穷大的话,浮点值使用IEEE754的向零舍入模式取整,获得整数值v,如果v在目标类型T(int或long)的表示范围之内,那转换结果就是v。否则,将根据v的符号,转换为T所能表示的最大或者最小正数.
  • 当将一个double类型窄化转换为float类型时,将遵循以下转换规则:
    • 如果转换结果的绝对值太小而无法使用float来表示,将返回float类型的正负零。
    • 如果转换结果的绝对值太大而无法使用float来表示,将返回float类型的正负无穷大。
    • 对于double类型的NaN值将按规定转换为float类型的NaN值。

例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
public class ClassCastTest {
public static void main(String[] args) {
double d1 = Double.NaN; //0.0 / 0.0
int i = (int)d1;
System.out.println(d1);//NaN
System.out.println(i);//0

double d2 = Double.POSITIVE_INFINITY;
long l = (long)d2;
int j = (int)d2;
System.out.println(l);//9223372036854775807
System.out.println(Long.MAX_VALUE);//9223372036854775807
System.out.println(j);//2147483647
System.out.println(Integer.MAX_VALUE);//2147483647

float f = (float)d2;
System.out.println(f);//Infinity

float f1 = (float)d1;
System.out.println(f1);//NaN
}
}

5、对象的创建与访问指令

  • Java是面向对象的程序设计语言,虚拟机平台从字节码层面就对面向对象做了深层次的支持。有一系列指令专门用于对象操作,可进一步细分为创建指令、字段访问指令、数组操作指令、类型检查指令。

5.1 创建指令

  • 虽然类实例和数组都是对象,但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令:
    • 创建类实例的指令:new。
      • 它接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入栈。
    • 创建数组的指令:newarray、anewarray、multianewarray。
      • newarray:创建基本类型数组
      • anewarray:创建引用类型数组
      • multianewarray:创建多维数组

例子1:

1
2
3
4
5
6
public class ClassCastTest {
public static void main(String[] args) {
Object obj = new Object();
File file = new File("test.txt");
}
}
1
2
3
4
5
6
7
8
9
10
 0 new #2 <java/lang/Object> //创建Object类型的对象,并将对象引用(地址值)压栈
3 dup //在操作数栈中复制一份地址引用
4 invokespecial #1 <java/lang/Object.<init>> //执行Object类的构造方法,此时栈顶的一个复制品出栈
7 astore_1 //将栈顶的地址引用赋值给局部变量表索引为1的位置
8 new #3 <java/io/File> //创建File类型的对象,并将对象引用(地址值)压栈
11 dup //在操作数栈中复制一份地址引用
12 ldc #4 <test.txt> //将字符串的地址值压栈
14 invokespecial #5 <java/io/File.<init>> //执行File类的构造方法,此时栈顶的字符串和一个复制品都会出栈
17 astore_2 //将栈顶的地址引用赋值给局部变量表索引为2的位置
18 return

例子2:

1
2
3
4
5
6
7
8
9
public class ClassCastTest {
public static void main(String[] args) {
int[] intArray = new int[10];
Object[] objArray = new Object[10];
int[][] mintArray = new int[10][10];

String[][] strArray = new String[10][];
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
 0 bipush 10
2 newarray 10 (int)
4 astore_1
5 bipush 10
7 anewarray #2 <java/lang/Object>
10 astore_2
11 bipush 10
13 bipush 10
15 multianewarray #3 <[[I> dim 2
19 astore_3
20 bipush 10
22 anewarray #4 <[Ljava/lang/String;>
25 astore 4
27 return

5.2 字段访问指令

  • 对象创建后,就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。
    • 访问类字段(static字段,或者称为类变量)的指令:getstatic、putstatic。
    • 访问类实例字段(非static字段,或者称为实例变量)的指令:getfield、putfield。

例子:

1
2
3
4
5
public class ClassCastTest {
public static void main(String[] args) {
System.out.println("hello");
}
}
1
2
3
4
0 getstatic #2 <java/lang/System.out>
3 ldc #3 <hello>
5 invokevirtual #4 <java/io/PrintStream.println>
8 return

例子2:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
public class ClassCastTest {
public static void main(String[] args) {
Order order = new Order();
order.id = 1001;
System.out.println(order.id);

Order.name = "ORDER";
System.out.println(Order.name);
}
}

class Order{
int id;
static String name;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 0 new #2 <com/java13/Order> //创建Order类型的对象,并将对象引用(地址值)压栈
3 dup //在操作数栈中复制一份地址引用
4 invokespecial #3 <com/java13/Order.<init>> //执行Order类的构造方法,此时栈顶的一个复制品出栈
7 astore_1 //将栈顶的地址存放在局部变量表索引为1的位置
8 aload_1 //将局部变量表索引为1的位置的地址值重新压栈
9 sipush 1001 //将1001压栈
12 putfield #4 <com/java13/Order.id> //将1001和地址值一起出栈,并调用order.id进行赋值
15 getstatic #5 <java/lang/System.out> //将System.out压栈
18 aload_1 //将局部变量表索引为1的位置的地址值压栈
19 getfield #4 <com/java13/Order.id> //将栈顶的地址值出栈后把order.id的值压栈
22 invokevirtual #6 <java/io/PrintStream.println> //将栈顶的值和System.out一起出栈完成方法调用
25 ldc #7 <ORDER> //将字符串的地址值压栈
27 putstatic #8 <com/java13/Order.name> //将字符串出栈并给Order.name直接赋值
30 getstatic #5 <java/lang/System.out> //将System.out压栈
33 getstatic #8 <com/java13/Order.name> //将Order.name压栈
36 invokevirtual #9 <java/io/PrintStream.println> //将System.out和Order.name出栈并完成方法调用
39 return

5.3 数组操作指令

  • 数组操作指令主要有:xastore和xaload令。具体为:

    • 把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload。
    • 将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、lastore、fastore、dastore、aastore。

    即如下表:

    数组类型 加载指令 存储指令
    byte(boolean) baload bastore
    char caload castore
    short saload sastore
    int iaload iastore
    long laload lastore
    float faload fastore
    double daload dastore
    reference aaload aastore
  • 取数组长度的指令:arraylength,该指令弹出栈顶的数组元素,获取数组的长度,将长度压入栈。

  • 指令xaload表示将数组的元素压栈,比如alcad、caload分别表示压入short数组和char数组。指令xaload在执行时,要求操作数中栈顶元素为数组索引i,栈顶顺位第2个元素为数组引用a,该指令会弹出栈顶这两个元素,并将a[i]重新压入堆栈。

  • xastore则专门针对数组操作,以iastore为例,它用于给一个int数组的给定索引赋值。在iastore执行前,操作数栈顶需要以此准备3个元素:值、索引、数组引用,iastore会弹出这3个值,并将值赋给数组中指定索引的位置。

例子1:

1
2
3
4
5
6
7
8
9
10
public class ClassCastTest {
public static void main(String[] args) {
int[] intArray = new int[10];
intArray[3] = 20;
System.out.println(intArray[1]);

boolean[] arr = new boolean[10];
arr[1] = true;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
 0 bipush 10 //将10压栈
2 newarray 10 (int) //将10出栈并new一个长度为10的int型数组,将其地址值入栈
4 astore_1 //将栈顶的数组地址值存放到局部变量表索引为1的位置
5 aload_1 //将局部变量表索引为1的位置的地址值重新入栈
6 iconst_3 //将3压栈
7 bipush 20 //将20压栈
9 iastore //将20、3和数组地址值依次出栈完成intArray[3] = 20
10 getstatic #2 <java/lang/System.out> //将System.out压栈
13 aload_1 //将局部变量表索引为1的位置的地址值入栈
14 iconst_1 //将1压栈
15 iaload //将1和数组地址值依次出栈,找到intArray[1]的值并入栈
16 invokevirtual #3 <java/io/PrintStream.println> //将intArray[1]的值和System.out出栈完成方法调用
19 bipush 10 //将10入栈
21 newarray 4 (boolean) //将10出栈并new一个长度为10的boolean型数组,将其地址值入栈
23 astore_2 //将栈顶的数组地址值存放到局部变量表索引为2的位置
24 aload_2 //将局部变量表索引为2的位置的地址值重新入栈
25 iconst_1 //将1压栈
26 iconst_1 //将1压栈
27 bastore //将两个1和地址值依次出栈完成arr[1] = true
28 return

例子2:

1
2
3
4
5
6
public class ClassCastTest {
public static void main(String[] args) {
double[] arr = new double[10];
System.out.println(arr.length);
}
}
1
2
3
4
5
6
7
8
 0 bipush 10 //将10压栈
2 newarray 7 (double) //将10出栈并new一个长度为10的double型数组,将其地址值入栈
4 astore_1 //将栈顶的数组地址值存放到局部变量表索引为1的位置
5 getstatic #2 <java/lang/System.out> //将System.out压栈
8 aload_1 //将局部变量表索引为1的位置的地址值入栈
9 arraylength //将栈顶数组地址值出栈并获取数组长度后将数组长度入栈
10 invokevirtual #3 <java/io/PrintStream.println> //将数组长度和System.out出栈完成方法调用
13 return

5.4 类型检查指令

  • 检查类实例或数组类型的指令:instanceof、checkcast。
    • 指令checkcast用于检查类型强制转换是否可以进行。如果可以进行,那么checkcast指令不会改变操作数栈,否则它会抛出ClassCastException异常。
    • 指令instanceof用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈(true或者false)。

例子:

1
2
3
4
5
6
7
8
9
public class ClassCastTest {
public String checkCast(Object obj) {
if (obj instanceof String) {
return (String) obj;
} else {
return null;
}
}
}
1
2
3
4
5
6
7
8
 0 aload_1 //将obj入栈
1 instanceof #2 <java/lang/String> //obj出栈,判断obj是否是String的实例
4 ifeq 12 (+8)
7 aload_1 //将obj入栈
8 checkcast #2 <java/lang/String> //将obj转换成String类型
11 areturn
12 aconst_null
13 areturn

6、方法调用与返回指令

6.1 方法调用指令

  • 以下5条指令用于方法调用:

    • invokevirtual指令用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),支持多态。这也是Java语言中最常见的方法分派方式。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    public class MethodInvokeReturnTest {
    //方法调用指令:invokeVirtual:动态分派
    public void invoke1(){
    System.out.println("hello");

    Thread t1 = null;
    t1.run();
    }
    }
    1
    2
    3
    4
    5
    6
    7
    8
     0 getstatic #2 <java/lang/System.out>
    3 ldc #3 <hello>
    5 invokevirtual #4 <java/io/PrintStream.println>
    8 aconst_null
    9 astore_1
    10 aload_1
    11 invokevirtual #5 <java/lang/Thread.run>
    14 return
    • invokeinterface指令用于调用接口方法,它会在运行时搜索由特定对象所实现的这个接口方法,并找出适合的方法进行调用。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    public class MethodInvokeReturnTest {
    //方法调用指令:invokeinterface
    public void invoke2(){
    Thread t1 = new Thread();
    ((Runnable)t1).run();

    Comparable<Integer> com = null;
    com.compareTo(123);
    }
    }
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     0 new #2 <java/lang/Thread>
    3 dup
    4 invokespecial #3 <java/lang/Thread.<init>>
    7 astore_1
    8 aload_1
    9 invokeinterface #4 <java/lang/Runnable.run> count 1
    14 aconst_null
    15 astore_2
    16 aload_2
    17 bipush 123
    19 invokestatic #5 <java/lang/Integer.valueOf>
    22 invokeinterface #6 <java/lang/Comparable.compareTo> count 2
    27 pop
    28 return

    而对于jdk8对接口进行了扩展(静态方法和默认方法)的情况:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    public class InterfaceMethodTest {
    public static void main(String[] args) {
    AA aa = new BB();

    aa.method2();//调用默认方法使用invokeinterface

    AA.method1();//调用静态方法使用invokestatic
    }
    }


    interface AA{
    public static void method1(){

    }

    public default void method2(){

    }
    }

    class BB implements AA{

    }
    1
    2
    3
    4
    5
    6
    7
    8
     0 new #2 <com/java13/BB>
    3 dup
    4 invokespecial #3 <com/java13/BB.<init>>
    7 astore_1
    8 aload_1
    9 invokeinterface #4 <com/java13/AA.method2> count 1
    14 invokestatic #5 <com/java13/AA.method1>
    17 return
    • invokespecial指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法(构造器)、私有方法和父类方法。这些方法都是静态类型绑定的,不会在调用时进行动态派发。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    public class MethodInvokeReturnTest {
    public void invoke3(){
    //情况1:类实例构造器方法:<init>()
    Date date = new Date();

    Thread t1 = new Thread();
    //情况2:父类的方法
    super.toString();
    //情况3:私有方法
    methodPrivate();
    }

    private void methodPrivate(){

    }
    }
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     0 new #2 <java/util/Date>
    3 dup
    4 invokespecial #3 <java/util/Date.<init>>
    7 astore_1
    8 new #4 <java/lang/Thread>
    11 dup
    12 invokespecial #5 <java/lang/Thread.<init>>
    15 astore_2
    16 aload_0
    17 invokespecial #6 <java/lang/Object.toString>
    20 pop
    21 aload_0
    22 invokespecial #7 <com/java13/MethodInvokeReturnTest.methodPrivate>
    25 return
    • invokestatic指令用于调用命名类中的类方法(static方法)。这是静态绑定的。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    public class MethodInvokeReturnTest {
    //方法调用指令:invokestatic:静态分派
    public void invoke4(){
    methodStatic();
    }
    public static void methodStatic(){

    }
    }
    1
    2
    0 invokestatic #2 <com/java13/MethodInvokeReturnTest.methodStatic>
    3 return
    • invokedynamic:调用动态绑定的方法,这个是JDK1.7后新加入的指令。用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。前面4条调用指令的分派逻辑都固化在java虚拟机内部,而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。
    1
    2
    3
    4
    5
    6
    7
    public class MethodInvokeReturnTest {
    public static void main(String[] args) {
    Runnable x = () -> {
    System.out.println("Hello, World!");
    };
    }
    }
    1
    2
    3
    0 invokedynamic #2 <run, BootstrapMethods #0>
    5 astore_1
    6 return

6.2 方法返回指令

  • 方法调用结束前,需要进行返回。方法返回指令是根据返回值的类型区分的。
    • 包括ireturn(当返回值是boolean、byte、char、short和int 类型时使用)、lreturn、freturn、dreturn和areturn。
    • 另外还有一条return指令供声明为void的方法、实例初始化方法以及类和接口的类初始化方法使用。
  • 通过ireturn指令,将当前函数操作数栈的顶层元素弹出,并将这个元素压入调用者函数的操作数栈中(因为调用者非常关心函数的返回值),所有在当前函数操作数栈中的其他元素都会被丢弃。
  • 如果当前返回的是synchronized方法,那么还会执行一个隐含的monitorexit指令,退出临界区。
  • 最后,会丢弃当前方法的整个帧,恢复调用者的帧,并将控制权转交给调用者。

例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
public class MethodInvokeReturnTest {
//0 aload_0
//1 invokespecial #1 <java/lang/Object.<init>>
//4 return
public MethodInvokeReturnTest(){

}

//方法的返回指令
//0 sipush 500
//3 istore_1
//4 iload_1
//5 ireturn
public int returnInt(){
int i = 500;
return i;
}

//0 dconst_0
//1 dreturn
public double returnDouble(){
return 0.0;
}

//0 ldc #2 <hello,world>
//2 areturn
public String returnString(){
return "hello,world";
}

//0 aconst_null
//1 areturn
public int[] returnArr(){
return null;
}

//0 bipush 10
//2 istore_1
//3 iload_1
//4 i2f
//5 freturn
public float returnFloat(){
int i = 10;
return i;
}

//0 iconst_0
//1 ireturn
public byte returnByte(){
return 0;
}

//0 aload_0
//1 invokevirtual #3 <com/java13/MethodInvokeReturnTest.returnByte>
//4 istore_1
//5 return
public void methodReturn(){
int i = returnByte();
}
}

7、操作数栈管理指令

  • 如同操作一个普通数据结构中的堆栈那样,JVM提供的操作数栈管理指令,可以用于直接操作操作数栈的指令。
  • 这类指令包括如下内容:
    • 将一个或两个元素从栈顶弹出,并且直接废弃:pop,pop2。
    • 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup,dup2,dup_x1,dup2_×1,dup_×2,dup2_×2。
      • 不带_x的指令是复制栈顶数据并压入栈顶。包括两个指令,dup和dup2。dup的系数代表要复制的Slot个数。
        • dup开头的指令用于复制1个slot的数据。例如1个int或1个reference类型数据。
        • dup2开头的指令用于复制2个slot的数据。例如1个long,或2个int,或1个int+1个float类型数据。
      • 带_x的指令是复制栈顶数据并插入栈顶以下的某个位置。共有4个指令,dup_×1,dup2_×1,dup_×2,dup2_×2。对于带_x的复制插入指令,只要将指令的dup和x的系数相加,结果即为需要插入的位置。
        • dup_×1插入位置:1+1=2,即栈顶2个slot下面。
        • dup_×2插入位置:1+2=3,即栈顶3个slot下面。
        • dup2_×1插入位置:2+1=3,即栈顶3个slot下面。
        • dup2_×2插入位置:2+2=4,即栈顶4个slot下面。
    • 将栈最顶端的两个slot数值位置交换:swap。Java虚拟机没有提供交换两个64位数据类型(
      long、double)数值的指令。
    • 指令nop,是一个非常特殊的指令,它的字节码为0x00。和汇编语言中的nop一样,它表示什么都不做。这条指令一般可用于调试、占位等。
  • 这些指令属于通用型,对栈的压入或者弹出无需指明数据类型。

例子1:

1
2
3
4
5
6
public class StackOperateTest {
public void print(){
Object obj = new Object();
String info = obj.toString();
}
}
1
2
3
4
5
6
7
8
 0 new #2 <java/lang/Object> //创建Object类型的对象,并将对象引用(地址值)压栈
3 dup //在操作数栈中复制一份地址引用
4 invokespecial #1 <java/lang/Object.<init>> //栈顶的一个复制品出栈,执行Object类的构造方法
7 astore_1 //将栈顶的地址值保存在局部变量表索引为1的位置
8 aload_1 //将局部变量表索引为1的位置的值压栈
9 invokevirtual #3 <java/lang/Object.toString> //栈顶的地址值出栈并执行toString方法,并将返回值压栈
12 astore_2 //栈顶数据出栈并保存在局部变量表索引为2的位置
13 return

如果改成以下代码:

1
2
3
4
5
6
public class StackOperateTest {
public void print(){
Object obj = new Object();
obj.toString();
}
}

会发现指令变成如下,唯一的不同是astore_2变成了pop,原因是此时obj.toString()返回的值用不到了,所以要弹栈。

1
2
3
4
5
6
7
8
 0 new #2 <java/lang/Object>
3 dup
4 invokespecial #1 <java/lang/Object.<init>>
7 astore_1
8 aload_1
9 invokevirtual #3 <java/lang/Object.toString>
12 pop
13 return

例子2:

1
2
3
4
5
6
7
8
public class StackOperateTest {
public void foo(){
bar();
}
public long bar(){
return 0;
}
}

其中foo()的字节码指令如下,可以发现在调用bar()返回的是一个8个字节的long类型数据,并且用不到,所以要用pop2指令弹栈:

1
2
3
4
0 aload_0
1 invokevirtual #2 <com/java13/StackOperateTest.bar>
4 pop2
5 return

例子3:

1
2
3
4
5
6
7
public class StackOperateTest {
public long nextIndex() {
return index++;
}

private long index = 0;
}
1
2
3
4
5
6
7
8
 0 aload_0 //将局部变量表索引为0位置的当前对象的地址值压栈
1 dup //在操作数栈中复制一份地址引用
2 getfield #2 <com/java13/StackOperateTest.index> //复制品出栈,返回index的值压栈
5 dup2_x1 //将栈顶的index(占用两个slot)复制一份插入到栈顶3个slot下面
6 lconst_1 //将1压栈
7 ladd //将index的值和1弹栈并做相加后压栈
8 putfield #2 <com/java13/StackOperateTest.index> //将1和当前对象的地址值一起出栈并将StackOperateTest.index赋值为1,即完成自增操作
11 lreturn //将栈顶的0返回

8、控制转移指令

  • 程序流程离不开条件控制,为了支持条件跳转,虚拟机提供了大量字节码指令,大体上可以分为:
    • 比较指令
    • 条件跳转指令
    • 比较条件跳转指令
    • 多条件分支跳转指令
    • 无条件跳转指令等

8.1 条件跳转指令

  • 条件跳转指令通常和比较指令结合使用。在条件跳转指令执行前,一般可以先用比较指令进行栈顶元素的准备,然后进行条件跳转。
  • 条件跳转指令有:ifeq,iflt,ifle,ifne,ifgt,ifge,ifnull,ifnonnull。这些指令都接收两个字节的操作数,用于计算跳转的位置(16位符号整数作为当前位置的offset)。
  • 它们的统一含义为:弹出栈顶元素,测试它是否满足某一条件,如果满足条件,则跳转到给定位置。
指令 描述
ifeq 当栈顶int类型数值等于0时跳转
ifne 当栈顶int类型数值不等于0时跳转
iflt 当栈顶int类型数值小于0时跳转
ifle 当栈顶int类型数值小于等于0时跳转
ifgt 当栈顶int类型数值大于0时跳转
ifge 当栈顶int类型数值大于等于0时跳转
ifnull 为null时跳转
ifnonnull 不为null时跳转
  • 与前面运算规则一致:
    • 对于boolean、byte、char、short类型的条件分支比较操作,都是使用int类型的比较指令完成。
    • 对于long、float、double类型的条件分支比较操作,则会先执行相应类型的比较运算指令,运算指令会返回一个整型值到操作数栈中,随后再执行int类型的条件分支比较操作来完成整个分支跳转。

例子1:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
public class IfSwitchGotoTest {
//条件跳转指令
public void compare1(){
int a = 0;
if(a != 0){
a = 10;
}else{
a = 20;
}
}
public boolean compareNull(String str){
if(str == null){
return true;
}else{
return false;
}
}
}

compare1()的字节码指令:

1
2
3
4
5
6
7
8
9
10
 0 iconst_0
1 istore_1
2 iload_1
3 ifeq 12 (+9) //栈顶数据出栈并判断其是否等于0,如果是则跳转到第12行指令继续执行
6 bipush 10
8 istore_1
9 goto 15 (+6) //无条件跳转到第15行指令,即返回
12 bipush 20
14 istore_1
15 return

compareNull()的字节码指令:

1
2
3
4
5
6
0 aload_1
1 ifnonnull 6 (+5) //栈顶数据出栈并判断其是否不等于null,如果是则跳转到第6行指令继续执行
4 iconst_1
5 ireturn
6 iconst_0
7 ireturn

例子2:

1
2
3
4
5
6
7
8
9
10
11
12
13
public class IfSwitchGotoTest {
//结合比较指令
public void compare1() {
float f1 = 9;
float f2 = 10;
System.out.println(f1 < f2);
}
public void compare2() {
int i1 = 10;
long l1 = 20;
System.out.println(i1 > l1);
}
}

compare1() 的字节码指令:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
 0 ldc #2 <9.0> //将9.0入栈
2 fstore_1 //栈顶数据保存到局部变量表索引为1的位置
3 ldc #3 <10.0> //将10.0入栈
5 fstore_2 //栈顶数据保存到局部变量表索引为2的位置
6 getstatic #4 <java/lang/System.out> //System.out入栈
9 fload_1 //局部变量表索引为1的位置的值(9.0)入栈
10 fload_2 //局部变量表索引为2的位置的值(10.0)入栈
11 fcmpg //将10.0和9.0依次出栈进行比较发现9.0<10.0,所以将-1压栈
12 ifge 19 (+7) //将-1出栈并判断它是否大于等于0,如果是则跳转到第19行指令继续执行
15 iconst_1 //将1入栈
16 goto 20 (+4)
19 iconst_0 //将0入栈
20 invokevirtual #5 <java/io/PrintStream.println> //将0或1出栈并调用方法打印结果
23 return

compare2() 的字节码指令:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 0 bipush 10
2 istore_1
3 ldc2_w #6 <20>
6 lstore_2
7 getstatic #4 <java/lang/System.out>
10 iload_1
11 i2l //将栈顶的int类型转化成long类型后入栈,此时占两个slot
12 lload_2
13 lcmp //将20和10依次出栈进行比较发现10<20,所以将-1压栈
14 ifle 21 (+7) //将-1出栈并判断它是否小于等于0,如果是则跳转到第21行指令继续执行
17 iconst_1
18 goto 22 (+4)
21 iconst_0
22 invokevirtual #5 <java/io/PrintStream.println>
25 return
  • 总结:比较指令主要针对long、float、double三类,比较完之后返回-1、0或者1,之后再用条件跳转指令;而如果本身是byte、short、char、boolean、int,则直接用条件跳转指令即可。

8.2 比较条件跳转指令

  • 比较条件跳转指令类似于比较指令和条件跳转指令的结合体,它将比较和跳转两个步骤合二为一。这类指令有:if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq和if_acmpne。
  • 其中指令助记符加上“if_”后,以字符“i”开头的指令针对int型整数操作(也包括short和byte类型),以字符“a”开头的指令表示对象引用的比较。
指令 描述
if_icmpeq 比较栈顶两int类型数值大小,当前者等于后者时跳转
if_icmpne 比较栈顶两int类型数值大小,当前者不等于后者时跳转
if_icmplt 比较栈顶两int类型数值大小,当前者小于后者时跳转
if_icmple 比较栈顶两int类型数值大小,当前者小于等于后者时跳转
if_icmpgt 比较栈顶两int类型数值大小,当前者大于后者时跳转
if_icmpge 比较栈顶两int类型数值大小,当前者大于等于后者时跳转
if_acmpeq 比较栈顶两引用类型数值,当结果相等时跳转
if_acmpne 比较栈顶两引用类型数值,当结果不相等时跳转

例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
public class IfSwitchGotoTest {
public void ifCompare1(){
int i = 10;
int j = 20;
System.out.println(i > j);
}
public void ifCompare2() {
short s1 = 9;
byte b1 = 10;
System.out.println(s1 > b1);
}

public void ifCompare3() {
Object obj1 = new Object();
Object obj2 = new Object();
System.out.println(obj1 == obj2);//false
System.out.println(obj1 != obj2);//true
}
}

ifCompare1()的字节码指令:

1
2
3
4
5
6
7
8
9
10
11
12
13
 0 bipush 10
2 istore_1
3 bipush 20
5 istore_2
6 getstatic #2 <java/lang/System.out>
9 iload_1
10 iload_2
11 if_icmple 18 (+7) //将20和10依次出栈并判断10是否小于等于20,如果是则跳转到第18行指令继续执行
14 iconst_1
15 goto 19 (+4)
18 iconst_0
19 invokevirtual #3 <java/io/PrintStream.println>
22 return

ifCompare2()的字节码指令如下,发现short和byte的比较也是用if_icmple:

1
2
3
4
5
6
7
8
9
10
11
12
13
 0 bipush 9
2 istore_1
3 bipush 10
5 istore_2
6 getstatic #2 <java/lang/System.out>
9 iload_1
10 iload_2
11 if_icmple 18 (+7)
14 iconst_1
15 goto 19 (+4)
18 iconst_0
19 invokevirtual #3 <java/io/PrintStream.println>
22 return

ifCompare3()的字节码指令:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
 0 new #4 <java/lang/Object>
3 dup
4 invokespecial #1 <java/lang/Object.<init>>
7 astore_1
8 new #4 <java/lang/Object>
11 dup
12 invokespecial #1 <java/lang/Object.<init>>
15 astore_2
16 getstatic #2 <java/lang/System.out>
19 aload_1
20 aload_2
21 if_acmpne 28 (+7) //将obj2和obj1依次出栈并判断obj1!=obj2是否成立,如果成立则跳转到第28行指令继续执行
24 iconst_1
25 goto 29 (+4)
28 iconst_0
29 invokevirtual #3 <java/io/PrintStream.println>
32 getstatic #2 <java/lang/System.out>
35 aload_1
36 aload_2
37 if_acmpeq 44 (+7) //将obj2和obj1依次出栈并判断obj1==obj2是否成立,如果成立则跳转到第44行指令继续执行
40 iconst_1
41 goto 45 (+4)
44 iconst_0
45 invokevirtual #3 <java/io/PrintStream.println>
48 return

8.3 多条件分支跳转

  • 多条件分支跳转指令是专为switch-case语句设计的,主要有tableswitch和lookupswitch。
指令名称 描述
tableswitch 用于switch条件跳转,case值连续
lookupswitch 用于switch条件跳转,case值不连续
  • 从助记符上看,两者都是switch语句的实现,它们的区别:

    • tableswitch要求多个条件分支值是连续的,它内部只存放起始值和终止值,以及若干个跳转偏移量,通过给定的操作数index,可以立即定位到跳转偏移量位置,因此效率比较高。指令tableswitch的示意图如下图所示。由于tableswitch的case值是连续的,因此只需要记录最低值和最高值,以及每一项对应的offset偏移量,根据给定的index值通过简单的计算即可直接定位到offset。

    • 指令lookupswitch内部存放着各个离散的case-offset对,每次执行都要搜索全部的case-offset对,找到匹配的case值,并根据对应的offset计算跳转地址,因此效率较低。指令lookupswitch处理的是离散的case值,但是出于效率考虑,将case-offset对按case值大小排序,给定index时,需要查找与index相等的case,获得其offset,如果找不到则跳转到default。指令lookupswitch如下图所示。

例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
public class IfSwitchGotoTest {
//多条件分支跳转
public void switch1(int select){
int num;
switch(select){
case 1:
num = 10;
break;
case 2:
num = 20;
//break;
case 3:
num = 30;
break;
default:
num = 40;
}

}
public void switch2(int select){
int num;
switch(select){
case 100:
num = 10;
break;
case 500:
num = 20;
break;
case 200:
num = 30;
break;
default:
num = 40;
}
}
//jdk7新特性:引入String类型
public void switch3(String season){
switch(season){
case "SPRING":break;
case "SUMMER":break;
case "AUTUMN":break;
case "WINTER":break;
}
}

}

switch1()的字节码指令:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
 0 iload_1
1 tableswitch 1 to 3 1: 28 (+27) //直接利用最高最低和偏移量定位
2: 34 (+33)
3: 37 (+36)
default: 43 (+42)
28 bipush 10
30 istore_2
31 goto 46 (+15)
34 bipush 20
36 istore_2
37 bipush 30
39 istore_2
40 goto 46 (+6)
43 bipush 40
45 istore_2
46 return

switch2()的字节码指令:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
 0 iload_1
1 lookupswitch 3 //从上往下匹配
100: 36 (+35)
200: 48 (+47)
500: 42 (+41)
default: 54 (+53)
36 bipush 10
38 istore_2
39 goto 57 (+18)
42 bipush 20
44 istore_2
45 goto 57 (+12)
48 bipush 30
50 istore_2
51 goto 57 (+6)
54 bipush 40
56 istore_2
57 return

switch3()的字节码指令:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
  0 aload_1
1 astore_2
2 iconst_m1
3 istore_3
4 aload_2
5 invokevirtual #2 <java/lang/String.hashCode>
8 lookupswitch 4 //将形参的hashcode分别与case处的hashcode比较
-1842350579: 52 (+44)
-1837878353: 66 (+58)
-1734407483: 94 (+86)
1941980694: 80 (+72)
default: 105 (+97)
52 aload_2
53 ldc #3 <SPRING>
55 invokevirtual #4 <java/lang/String.equals> //如果hashcode相同再用equals比较
58 ifeq 105 (+47)
61 iconst_0
62 istore_3
63 goto 105 (+42)
66 aload_2
67 ldc #5 <SUMMER>
69 invokevirtual #4 <java/lang/String.equals>
72 ifeq 105 (+33)
75 iconst_1
76 istore_3
77 goto 105 (+28)
80 aload_2
81 ldc #6 <AUTUMN>
83 invokevirtual #4 <java/lang/String.equals>
86 ifeq 105 (+19)
89 iconst_2
90 istore_3
91 goto 105 (+14)
94 aload_2
95 ldc #7 <WINTER>
97 invokevirtual #4 <java/lang/String.equals>
100 ifeq 105 (+5)
103 iconst_3
104 istore_3
105 iload_3
106 tableswitch 0 to 3 0: 136 (+30)
1: 139 (+33)
2: 142 (+36)
3: 145 (+39)
default: 145 (+39)
136 goto 145 (+9)
139 goto 145 (+6)
142 goto 145 (+3)
145 return

8.4 无条件跳转指令

  • 目前主要的无条件跳转指令为goto。指令goto接收两个字节的操作数,共同组成一个带符号的整数,用于指定指令的偏移量,指令执行的目的就是跳转到偏移量给定的位置处。
  • 如果指令偏移量太大,超过双字节的带符号整数的范围,则可以使用指令goto_w,它和goto有相同的作用,但是它接收4个字节的操作数,可以表示更大的地址范围。
  • 指令jsr、jsr_w、ret虽然也是无条件跳转的,但主要用于try-finally语句,且已经被虚拟机逐渐废弃,故不在这里介绍这两个指令。
指令名称 描述
goto 无条件跳转
goto_w 无条件跳转(宽索引)
jsr 跳转至指定16位offset位置,并将jsr下一条指令地址压入栈顶
jsr_w 跳转至指定32位offset位置,并将jsr_w下一条指令地址压入栈顶
ret 返回至由指定的局部变量所给出的指令位置(一般与jsr、jsr_w联合使用)

9、异常处理指令

9.1 抛出异常指令

  • athrow指令
    • 在Java程序中显示抛出异常的操作(throw语句)都是由athrow指令来实现。
    • 除了使用throw语句显示抛出异常情况之外,JVM规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出。例如,在之前介绍的整数运算时,当除数为零时,虚拟机会在idiv或ldiv指令中抛出ArithmeticException异常。
    • 正常情况下,操作数栈的压入弹出都是一条条指令完成的。唯一的例外情况是在抛异常时,Java虚拟机会清除操作数栈上的所有内容,而后将异常实例压入调用者操作数栈上。

例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
public class ExceptionTest {
public void throwZero(int i){
if(i == 0){
throw new RuntimeException("参数值为0");
}
}
public void throwOne(int i) throws RuntimeException{
if(i == 1){
throw new RuntimeException("参数值为1");
}
}
public void throwArithmetic() {
int i = 10;
int j = i / 0;
System.out.println(j);
}
}

throwZero()对应的字节码指令:

1
2
3
4
5
6
7
8
 0 iload_1
1 ifne 14 (+13)
4 new #2 <java/lang/RuntimeException>
7 dup
8 ldc #3 <参数值为0>
10 invokespecial #4 <java/lang/RuntimeException.<init>>
13 athrow //抛出后此方法对应栈帧结束,接着把此异常对象放到调用者对应栈帧的操作数栈中
14 return

throwOne()对应的字节码指令如下,基本和上面没什么区别,但是会发现多了个和code属性并列的异常属性,说明code属性是用来刻画方法体的,而throws是在方法的声明处,是用来刻画方法的,所以是另外一个属性:

1
2
3
4
5
6
7
8
9
 0 iload_1
1 iconst_1
2 if_icmpne 15 (+13)
5 new #2 <java/lang/RuntimeException>
8 dup
9 ldc #5 <参数值为1>
11 invokespecial #4 <java/lang/RuntimeException.<init>>
14 athrow
15 return

throwArithmetic()对应的字节码指令如下,可以发现由于数学异常是虚拟机定义好的异常,所以在字节码指令中找不到任何throw指令。

1
2
3
4
5
6
7
8
9
10
 0 bipush 10
2 istore_1
3 iload_1
4 iconst_0
5 idiv
6 istore_2
7 getstatic #6 <java/lang/System.out>
10 iload_2
11 invokevirtual #7 <java/io/PrintStream.println>
14 return

9.2 异常处理和异常表

  • 在Java虚拟机中,处理异常(catch语句)不是由字节码指令来实现的(早期使用jsr、ret指令),而是采用异常表来完成的。
  • 如果一个方法定义了一个try-catch或者try-finally的异常处理,就会创建一个异常表。它包含了每个异常处理或者finally块的信息。异常表保存了每个异常处理信息。比如:
    • 起始位置
    • 结束位置
    • 程序计数器记录的代码处理的偏移地址
    • 被捕获的异常类在常量池中的索引
  • 当一个异常被抛出时,JVM会在当前的方法里寻找一个匹配的处理,如果没有找到,这个方法会强制结束并弹出当前栈帧,并且异常会重新抛给上层调用的方法(在调用方法栈帧)。如果在所有栈帧弹出前仍然没有找到合适的异常处理,这个线程将终止。如果这个异常在最后一个非守护线程里抛出,将会导致JVM自己终止,比如这个线程是个main线程。
  • 不管什么时候抛出异常,如果异常处理最终匹配了所有异常类型,代码就会继续执行。在这种情况下,如果方法结束后没有抛出异常,仍然执行finally块,在return前,它直接跳到finally块来完成目标。

例子1:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public class ExceptionTest {
public void tryCatch() {
try {
File file = new File("d:/hello.txt");
FileInputStream fis = new FileInputStream(file);

String info = "hello!";
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (RuntimeException e) {
e.printStackTrace();
}
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
 0 new #2 <java/io/File>
3 dup
4 ldc #3 <d:/hello.txt>
6 invokespecial #4 <java/io/File.<init>>
9 astore_1
10 new #5 <java/io/FileInputStream>
13 dup
14 aload_1
15 invokespecial #6 <java/io/FileInputStream.<init>>
18 astore_2
19 ldc #7 <hello!>
21 astore_3
22 goto 38 (+16)
25 astore_1 //出现异常时异常对象会先入栈,这里是把异常对象的地址存到局部变量表索引为1的位置
26 aload_1
27 invokevirtual #9 <java/io/FileNotFoundException.printStackTrace>
30 goto 38 (+8)
33 astore_1
34 aload_1
35 invokevirtual #11 <java/lang/RuntimeException.printStackTrace>
38 return

字节码文件中有个异常表,分别记录了不同异常的处理返回:

例子2:

1
2
3
4
5
6
7
8
9
10
11
public class ExceptionTest {
public static String func() {
String str = "hello";
try{
return str;
}
finally{
str = "perfectcode.top";
}
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
 0 ldc #2 <hello> //字符串的地址入栈
2 astore_0 //栈顶数值存到局部变量表索引为0的位置
3 aload_0 //局部变量表索引为1的位置的值入栈
4 astore_1 //栈顶数值存到局部变量表索引为1的位置(这里相当于把原来的地址复制了一份)
5 ldc #3 <perfectcode.top> //另一个字符串的地址入栈
7 astore_0 //栈顶数值存到局部变量表索引为0的位置(这里相当于新的字符串地址覆盖了原地址)
8 aload_1 //局部变量表索引为1的位置的值(旧的字符串地址)入栈
9 areturn
10 astore_2 //如果出现异常会提前把异常对象入栈,这里是把异常对象的地址存到局部变量表索引为2的位置
11 ldc #3 <perfectcode.top>
13 astore_0
14 aload_2
15 athrow

异常表如下:

10、同步控制指令

  • java虚拟机支持两种同步结构:方法级的同步方法内部一段指令序列的同步,这两种同步都是使用monitor来支持的。

10.1 方法的同步

  • 方法级的同步:是隐式的,即无须通过字节码指令来控制,它实现在方法调用和返回操作之中。虚拟机可以从方法常量池的方法表结构中的ACC_SYNCHRONIZED访问标志得知一个方法是否声明为同步方法。
  • 当调用方法时,调用指令将会检查方法的ACC_SYNCHRONIZED访问标志是否设置。
    • 如果设置了,执行线程将先持有同步锁,然后执行方法。最后在方法完成(无论是正常完成还是非正常完成)时释放同步锁。
    • 在方法执行期间,执行线程持有了同步锁,其他任何线程都无法再获得同一个锁。
    • 如果一个同步方法执行期间抛出了异常,并且在方法内部无法处理此异常,那这个同步方法所持有的锁将在异常抛到同步方法之外时自动释放。

例子:

1
2
3
4
5
6
public class SynchronizedTest {
private int i = 0;
public synchronized void add(){
i++;
}
}

这段代码和普通的无同步操作的代码没有什么不同,没有使用monitorenter和monitorexit进行同步区控制。这是因为,对于同步方法而言,当虚拟机通过方法的访问标示符判断是一个步方法时,会自动在方法调用前进行加锁,当同步方法执行完毕后,不管方法是正常结束还是有异常抛出,均会由虚拟机释放这个锁。因此,对于同步方法而言,monitorenter和nonitorexit指令是隐式存在的,并未直接出现在字节码中。

1
2
3
4
5
6
7
 0 aload_0
1 dup
2 getfield #2 <com/java13/SynchronizedTest.i>
5 iconst_1
6 iadd
7 putfield #2 <com/java13/SynchronizedTest.i>
10 return

从字节码指令中看不出此方法的任何与synchronized有关的指令,因此是隐式的,相关描述是存放在方法的访问标志中的,如图:

10.2 方法内指定指令序列的同步

  • 同步一段指令集序列:通常是由java中的synchronized语句块来表示的。jvm的指令集有monitorenter和monitorexit 两条指令来支持synchronized关键字的语义。
  • 当一个线程进入同步代码块时,它使用monitorenter指令请求进入。如果当前对象的监视器计数器为0,则它会被准许进入若为1,则判断持有当前监视器的线程是否为自己,如果是,则进入,否则进行等待,直到对象的监视器计数器为0,才会被允许进入同步块。
  • 当线程退出同步块时,需要使用monitorexit声明退出。在Java虚拟机中,任何对象都有一个监视器与之相关联,用来判断对象是否被锁定,当监视器被持有后,对象处于锁定状态。
  • 指令monitorenter和monitorexit在执行时,都需要在操作数栈顶压入对象,之后monitorenter和monitorexit的锁定和释放都是针对这个对象的监视器进行的。

例子:

1
2
3
4
5
6
7
8
9
public class SynchronizedTest {
private int i = 0;
private Object obj = new Object();
public void subtract(){
synchronized (obj){
i--;
}
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
 0 aload_0
1 getfield #4 <com/java13/SynchronizedTest.obj>
4 dup
5 astore_1
6 monitorenter //如果同步监视器obj的计数器为0,则obj出栈并把计数器改为1
7 aload_0
8 dup
9 getfield #2 <com/java13/SynchronizedTest.i>
12 iconst_1
13 isub
14 putfield #2 <com/java13/SynchronizedTest.i>
17 aload_1 //将局部变量表索引为1位置的obj的地址入栈
18 monitorexit //obj出栈并把计数器重新改成0
19 goto 27 (+8)
22 astore_2 //将异常对象出栈并保存到局部变量表索引为2的位置
23 aload_1
24 monitorexit //将同步监视器obj的计数器改成0
25 aload_2 //将异常对象重新压栈
26 athrow //弹出异常对象并throw给方法的调用者
27 return

会发现有个异常表,用来当同步代码块里出现异常时,将同步监视器obj的计数器重新设置为0,以便其它线程能正常进入: