1、概述
- Java字节码对于虚拟机,就好像汇编语言对于计算机,属于基本执行指令。
- Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数,Operands)而构成。由于Java虚拟机采用面向操作数栈而不是寄存器的结构,所以大多数的指令都不包含操作数,只有一个操作码。
- 由于限制了Java虚拟机操作码的长度为一个字节(即0~255),这意味着指令集的操作码总数不可能超过256条。官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html
- 熟悉虚拟机的指令对于动态字节码生成、反编译Class文件、Class文件修补都有着非常重要的价值。因此,阅读字节码作为了解Java虚拟机的基础技能,需要熟练掌握常见指令。
1.1 执行模型
1.2 字节码与数据类型
- 在Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。例如,iload指令用于从局部变量表中加载int型的数据到操作数栈中,而fload指令加载的则是float类型的数据。
- 对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务:
- i代表对int类型的数据操作。
- l代表long。
- s代表short。
- b代表byte。
- c代表char。
- f代表float。
- d代表double。
- 也有一些指令的助记符中没有明确地指明操作类型的字母,如arraylength指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象。
- 还有另外一些指令,如无条件跳转指令goto则是与数据类型无关的。
- 大部分的指令都没有支持整数类型byte、char和short,甚至没有任何指令支持boolean类型。编译器会在编译期或运行期将byte和short类型的数据带符号扩展(Sign-Extend)为相应的int类型数据,将boolean和char类型数据零位扩展(Zero-Extend)为相应的int类型数据。与之类似,在处理boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。因此,大多数对于boolean、byte、short和char类型数据的操作,实际上都是使用相应的int类型作为运算类型。
1.3 指令分类
- JVM中的字节码指令集按用途大致分成9类:
- 加载与存储指令
- 算术指令
- 类型转换指令
- 对象的创建与访问指令
- 方法调用与返回指令
- 操作数栈管理指令
- 比较控制指令
- 异常处理指令
- 同步控制指令
- 一个指令,可以从局部变量表、常量池、堆中对象、方法调用、系统调用中等取得数据,这些数据(可能是值,可能是对象的引用)被压入操作数栈。
- 一个指令,也可以从操作数栈中取出一到多个值(pop多次),完成赋值、加减乘除、方法传参、系统调用等等操作。
2、加载与存储指令
- 作用:加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递。
- 常用指令
- 【局部变量压栈指令】将一个局部变量加载到操作数栈:xload、xload_(其中x为i、1、f、d、a,n为0到3)
- 【常量入栈指令】将一个量加载到操作数栈:bipush、sipush、ldc、1dc_w、ldc2_w、aconst_null、iconst_ml、iconst_、lconst_、fconst_、dconst_。
- 【出栈装入局部变量表指令】将一个数值从操作数栈存储到局部变量表:xstore、xstore_(其中x为i、l、f、d、a,n为0到3);xastore(其中x为i、l、f、d、a、b、c、s)。
- 扩充局部变量表的访问索引的指令:wide。
- 上面所列举的指令助记符中,有一部分是以尖括号结尾的(例如iload_)。这些指令助记符实际上代表了一组指令(例如iload_代表了iload_0、iload_1、iload_2和iload_3这几个指令)。这几组指令都是某个带有一个操作数的通用指令(例如iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中。
- 除此之外,它们的语义与原生的通用指令完全一致(例如iload_0的语义与操作数为0时的iload指令语义完全一致)。在尖括号之间的字母指定了指令隐含操作数的数据类型,代表非负的整数,代表是int类型数据,代表long类型,代表float类型,代表double类型。操作byte、char、short和boolean型数据时,经常用int类型的指令来表示。
2.1 操作数栈和局部变量表
- 操作数栈
- Java字节码是Java虚拟机所使用的指令集。因此,它与Java虚拟机基于栈的计算模型是密不可分的。在解释执行过程中,每当为Java方法分配栈桢时,Java虚拟机往往需要开辟一块额外的空间作为操作数栈,来存放计算的操作数以及返回结果。
- 具体来说便是:执行每一条指令之前,Java虚拟机要求该指令的操作数已被压入操作数栈中。在执行指令时,Java虚拟机会将该指令所需的操作数弹出,并且将指令的结果重新压入栈中。
- 局部变量表
- Java方法栈桢的另外一个重要组成部分则是局部变量区,字节码程序可以将计算的结果缓存在局部变量区之中。实际上,Java虚拟机将局部变量区当成一个数组,依次存放this指针(仅非静态方法),所传入的参数,以及字节码中的局部变量。
- 和操作数栈一样,long类型以及double类型的值将占据两个单元,其余类型仅占据一个单元。(一个slot占据4个字节)
2.2 局部变量压栈指令
- 局部变量压栈指令将给定的局部变量表中的数据压入操作数栈。
- 这类指令大体可以分为(说明:在这里,x的取值表示数据类型):
- xload_(x为i、l、f、d、a,n为0到3)
- xload(x为i、1、f、d、a)
- 指令xload_n表示将第n个局部变量压入操作数栈,比如iload_1、fload_0、aload_0等指令。其中aload_n表示将一个对象引用压栈。
- 指令xload通过指定参数的形式,把局部变量压入操作数栈,当使用这个命令时,表示局部变量的数量可能超过了4个,比如指令iload、fload等。
例子:
1 2 3 4 5 6 7 8 9
| public class LoadAndStoreTest { public void load(int num, Object obj,long count,boolean flag,short[] arr) { System.out.println(num); System.out.println(obj); System.out.println(count); System.out.println(flag); System.out.println(arr); } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| 0 getstatic #2 <java/lang/System.out> 3 iload_1 //将num压入操作数栈 4 invokevirtual #3 <java/io/PrintStream.println> 7 getstatic #2 <java/lang/System.out> 10 aload_2 //将obj压入操作数栈 11 invokevirtual #4 <java/io/PrintStream.println> 14 getstatic #2 <java/lang/System.out> 17 lload_3 //将count压入操作数栈 18 invokevirtual #5 <java/io/PrintStream.println> 21 getstatic #2 <java/lang/System.out> 24 iload 5 //将flag压入操作数栈 26 invokevirtual #6 <java/io/PrintStream.println> 29 getstatic #2 <java/lang/System.out> 32 aload 6 //将arr压入操作数栈 34 invokevirtual #4 <java/io/PrintStream.println> 37 return
|
2.3 常量入栈指令
- 常量入栈指令的功能是将常数压入操作数栈,根据数据类型和入栈内容的不同,又可以分为const系列、push系列和ldc指令。
- 指令const系列:
- 用于对特定的常量入栈,入栈的常量隐含在指令本身里。指令有:iconst_(i从-1到5)、lconst_(l从0到1)、fconst_(f从0到2)、dconst_(d从0到l)、aconst_null。
- 比如:
- iconst_m1:将-1压入操作数栈。
- iconst_x(x为0到5)将x压入栈。
- lconst_0、lconst_1分别将长整数0和1压入栈。
- fconst_0、fconst_1、fconst_2分别将浮点数0、1、2压入栈。
- dconst_0和dconst_1分别将double型0和1压入栈。
- aconst_nu11将null压入操作数栈。
- 从指令的命名上不难找出规律,指令助记符的第一个字符总是喜欢表示数据类型,i表示整数,1表示长整数,f表示浮点数,d表示双精度浮点,习惯上用a表示对象引用。如果指令隐含操作的参数,会以下划线形式给出。
- 指令push系列:
- 主要包括bipush和sipush。它们的区别在于接收数据类型的不同,bipush接收8位整数作为参数,sipush接收16位整数,它们都将参数压入栈。
- 指令ldc系列:
- 如果以上指令都不能满足需求,那么可以使用万能的ldc指令,它可以接收一个8位的参数,该参数指向常量池中的int、float或者string的索引,将指定的内容压入堆栈。
- 类似的还有ldc_w,它接收两个8位参数,能支持的索引范围大于ldc。
- 如果要压入的元素是long或者double类型的,则使用ldc2_w指令,使用方式都是类似的。
类型 |
常数指令 |
范围 |
int(boolean、byte、char、short) |
iconst |
[-1,5] |
|
bipush |
[-128,127] |
|
sipush |
[-32768,32767] |
|
ldc |
any int value |
long |
lconst |
0,1 |
|
ldc |
any long value |
float |
fconst |
0,1,2 |
|
ldc |
any float value |
double |
dconst |
0,1 |
|
ldc |
any doublet value |
reference |
aconst |
null |
|
ldc |
String literal,Class literal |
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| public class LoadAndStoreTest { public void pushConstLdc() { int i = -1; int a = 5; int b = 6; int c = 127; int d = 128; int e = 32767; int f = 32768;
long a1 = 1; long a2 = 2; float b1 = 2; float b2 = 3; double c1 = 1; double c2 = 2; Date d1 = null; } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
| 0 iconst_m1 //将int类型常量-1压入栈 1 istore_1 2 iconst_5 //将int类型常量5压入栈 3 istore_2 4 bipush 6 //将一个8位带符号整数6压入栈 6 istore_3 7 bipush 127 //将一个8位带符号整数127压入栈 9 istore 4 11 sipush 128 //将一个16位带符号整数128压入栈 14 istore 5 16 sipush 32767 //将一个16位带符号整数32767压入栈 19 istore 6 21 ldc #2 <32768> //把常量池中的第2项(Integer类型的32768)压入栈 23 istore 7 25 lconst_1 将long类型常量1压入栈 26 lstore 8 28 ldc2_w #3 <2> 把常量池中的第3项(long类型的2)压入栈 31 lstore 10 33 fconst_2 将float类型常量2压入栈 34 fstore 12 36 ldc #5 <3.0> 把常量池中的第5项(float类型的3.0)压入栈 38 fstore 13 40 dconst_1 //将double类型常量0压入栈 41 dstore 14 43 ldc2_w #6 <2.0> 把常量池中的第6项(double类型的2.0)压入栈 46 dstore 16 48 aconst_null //将null对象引用压入栈 49 astore 18 51 return
|
2.4 出栈装入局部变量表指令
- 出栈装入局部变量表指令用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定位置,用于给局部变量赋值。
- 这类指令主要以store的形式存在,比如xstore(x为i、l、f、d、a)、xstore_n(x为i、l、f、d、a,n为0至3)。
- 其中,指令istore_n将从操作数栈中弹出一个整数,并把它赋值给局部变量索引n位置。
- 指令xstore由于没有隐含参数信息,故需要提供一个byte类型的参数类指定目标局部变量表的位置。
- 一般说来,类似像store这样的命令需要带一个参数,用来指明将弹出的元素放在局部变量表的第几个位置。但是,为了尽可能压缩指令大小,使用专门的istore_1指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有istore_0、istore_2、istore_3,它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第0、2、3个位置。
- 由于局部变量表前几个位置总是非常常用,因此这种做法虽然增加了指令数量,但是可以大大压缩生成的字节码的体积。如果局部变量表很大,需要存储的槽位大于3,那么可以使用istore指令,外加一个参数,用来表示需要存放的槽位位置。
例子:
1 2 3 4 5 6 7 8 9
| public class LoadAndStoreTest { public void store(int k, double d) { int m = k + 2; long l = 12; String str = "perfectcode.top"; float f = 10.0F; d = 10; } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13
| 0 iload_1 //将局部变量表中索引为1的数k压入操作数栈 1 iconst_2 //将int类型常量2压入栈 2 iadd //先弹栈并进行加法运算后把结果重新压栈 3 istore 4 //将栈顶数据类型为int的值存入局部变量表索引4的位置 5 ldc2_w #2 <12> //把常量池中的第2项(long类型的12)压入栈 8 lstore 5 //将栈顶数据类型为long的值存入局部变量表索引5的位置 10 ldc #4 <perfectcode.top> //把常量池中的第4项(String类型的地址引用)压入栈 12 astore 7 //将栈顶数据类型为String的地址引用存入局部变量表索引7的位置 14 ldc #5 <10.0> //把常量池中的第5项(float类型的10.0)压入栈 16 fstore 8 //将栈顶数据类型为float的值存入局部变量表索引8的位置 18 ldc2_w #6 <10.0> //把常量池中的第6项(double类型的10.0)压入栈 21 dstore_2 //将栈顶数据类型为double的值存入局部变量表索引2的位置 22 return
|
3、算术指令
- 作用:算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新压入操作数栈。
- 大体上算术指令可以分为两种:对整型数据进行运算的指令与对浮点类型数据进行运算的指令。
- byte、short、char和boolean类型说明
- 在每一大类中,都有针对Java虚拟机具体数据类型的专用算术指令。但没有直接支持byte、short、char和boolean类型的算术指令,对于这些数据的运算,都使用int类型的指令来处理。此外,在处理boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。
- 运算时的溢出
- 数据运算可能会导致溢出,例如两个很大的正整数相加,结果可能是一个负数。其实Java虚拟机规范并无明确规定过整型数据溢出的具体结果,仅规定了在处理整型数据时,只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出异常ArithmeticException。
- 运算模式
- 向最接近数舍入模式:JVM要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的。
- 向零舍入模式:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果。
- NaN值使用
- 当一个操作产生溢出时,将会使用有符号的无穷大表示,如果某个操作结果没有明确的数学定义的话,将会使用NaN值来表示。而且所有使用NaN值作为操作数的算术操作,结果都会返回NaN。
例子:
1 2 3 4 5 6 7 8 9 10 11 12
| public class ArithmeticTest { public static void main(String[] args) { int i = 10; double j = i / 0.0; System.out.println(j);
double d1 = 0.0; double d2 = d1 / 0.0; System.out.println(d2); } }
|
3.1 所有算术指令
- 加法指令:iadd、ladd、fadd、dadd
- 减法指令:isub、lsub、fsub、dsub
- 乘法指令:imul、lmul、fmul、dmul
- 除法指令:idiv、ldiv、fdiv、ddiv
- 求余指令:irem、lrem、frem、drem(remainder:余数)
- 取反指令:ineg、lneg、fneg、dneg(negation:取反)
- 自增指令:iinc
- 位运算指令,又可分为:
- 位移指令:ishl、ishr、iushr、lshl、lshr、lushr
- 按位或指令:ior、lor
- 按位与指令:iand、land
- 按位异或指令:ixor、lxor
- 比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp
例子1:
1 2 3 4 5 6 7
| public class ArithmeticTest { public static void main(String[] args) { float i = 10; float j = -i; i = -j; } }
|
1 2 3 4 5 6 7 8 9
| 0 ldc #2 <10.0> //把常量池中的第2项(float类型的10.0)压入栈 2 fstore_1 //将栈顶数据类型为float的值存入局部变量表索引1的位置 3 fload_1 //将局部变量表中索引为1的数压入操作数栈 4 fneg //将操作数栈顶的数取出后进行取反后重新压栈 5 fstore_2 //将栈顶数据类型为float的值存入局部变量表索引2的位置 6 fload_2 //将局部变量表中索引为2的数压入操作数栈 7 fneg //将操作数栈顶的数取出后进行取反后重新压栈 8 fstore_1 //将栈顶数据类型为float的值存入局部变量表索引1的位置 9 return
|
例子2:
1 2 3 4 5 6
| public class ArithmeticTest { public static void main(String[] args) { int i = 100; i += 10; } }
|
1 2 3 4
| 0 bipush 100 //将一个8位带符号整数100压入栈 2 istore_1 //将栈顶数据类型为int的值存入局部变量表索引1的位置 3 iinc 1 by 10 //将局部变量表索引为1的值加上10 6 return
|
例子3:
1 2 3 4 5 6 7
| public class ArithmeticTest { public static void main(String[] args) { int i = 10; i++; } }
|
1 2 3 4
| 0 bipush 10 //将10压栈 2 istore_1 //将栈顶数据存入局部变量表索引为1的位置 3 iinc 1 by 1 //局部变量表索引为1的值作自增操作 6 return
|
i++和++i在不涉及赋值操作时,字节码指令都是相同的,即效率没有区别。
例子4:
1 2 3 4 5 6 7 8 9
| public class ArithmeticTest { public static void main(String[] args) { int i = 10; int a = i++;
int j = 20; int b = ++j; } }
|
1 2 3 4 5 6 7 8 9 10 11
| 0 bipush 10 //将10压栈 2 istore_1 //将栈顶数据存入局部变量表索引为1的位置 3 iload_1 //将局部变量表索引为1的值压栈 4 iinc 1 by 1 //局部变量表索引为1的值作自增操作 7 istore_2 //将栈顶数据放进局部变量表索引为2的位置 8 bipush 20 //将20压栈 10 istore_3 //将栈顶数据放进局部变量表索引为3的位置 11 iinc 3 by 1 //局部变量表索引为3的值作自增操作 14 iload_3 //将局部变量表索引为3的值压栈 15 istore 4 //将栈顶数据放进局部变量表索引为4的位置 17 return
|
例子5:
1 2 3 4 5 6 7
| public class ArithmeticTest { public static void main(String[] args) { int i = 10; i = i++; System.out.println(i); } }
|
1 2 3 4 5 6 7 8 9
| 0 bipush 10 //将10压栈 2 istore_1 //将栈顶数据存入局部变量表索引为1的位置 3 iload_1 //将局部变量表索引为1的值压栈 4 iinc 1 by 1 //局部变量表索引为1的值作自增操作 7 istore_1 //将栈顶数据存入局部变量表索引为1的位置,此时局部变量表中索引为1的已经经过自增操作的值被覆盖,又变为原来的数 8 getstatic #2 <java/lang/System.out> 11 iload_1 12 invokevirtual #3 <java/io/PrintStream.println> 15 return
|
3.2 比较指令
- 比较指令的作用是比较栈顶两个元素的大小,并将比较结果入栈。比较指令有:dcmpg,dcmpl、fcmpg、fcmpl、lcmp。
- 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令。以float为例,有fcmpg和fcmpl两个指令,它们的区别在于在数字比较时,若遇到NaN值,处理结果不同。
- 指令dcmpl和dcmpg也是类似的,根据其命名可以推测其含义,在此不再赘述。
- 指令lcmp针对long型整数,由于long型整数没有NaN值,故无需准备两套指令。
- 举例
- 指令fcmpg和fcmpl都从栈中弹出两个操作数,并将它们做比较,设栈顶的元素为v2,栈顶顺位第2位的元素为v1,若v1=v2,则压入0;若v1>v2则压入1;若v1<v2则压入-1。两个指令的不同之处在于,如果遇到NaN值,fcmpg会压入1,而fcmp1会压入-1。
4、类型转换指令
- 类型转换指令可以将两种不同的数值类型进行相互转换。
- 这些转换操作一般用于实现用户代码中的显式类型转换操作,或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。
4.1 宽化类型转换
- Java虚拟机直接支持以下数值的宽化类型转换(widening numeric conversion,小范围类型向大范围类型的安全转换)。也就是说,并不需要指令执行,包括:
- 从int类型到long、float或者double类型。对应的指令为:i2l、i2f、i2d。
- 从long类型到float、double类型。对应的指令为:l2f、l2d。
- 从float类型到double类型。对应的指令为:f2d。
- 简化为:int–>long–>float–>double
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13
| public class ClassCastTest { public static void main(String[] args) { int i = 10; long l = i; float f = i; double d = i;
float f1 = l; double d1 = l;
double d2 = f1; } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| 0 bipush 10 2 istore_1 3 iload_1 4 i2l 5 lstore_2 6 iload_1 7 i2f 8 fstore 4 10 iload_1 11 i2d 12 dstore 5 14 lload_2 15 l2f 16 fstore 7 18 lload_2 19 l2d 20 dstore 8 22 fload 7 24 f2d 25 dstore 10 27 return
|
- 精度损失问题
- 宽化类型转换是不会因为超过目标类型最大值而丢失信息的,例如,从int转换到1ong,或者从int转换到double,都不会丢失任何信息,转换前后的值是精确相等的。
- 从int、long类型数值转换到float,或者long类型数值转换到double时,将可能发生精度丢失——可能丢失掉几个最低有效位上的值,转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数值。
- 尽管宽化类型转换实际上是可能发生精度丢失的,但是这种转换永远不会导致Java虚拟机抛出运行时异常。
例子:
1 2 3 4 5 6 7 8 9 10 11
| public class ClassCastTest { public static void main(String[] args) { int i = 123123123; float f = i; System.out.println(f);
long l = 123123123123123123L; double d = l; System.out.println(d); } }
|
- 从byte、char和short类型到int类型的宽化类型转换实际上是不存在的。对于byte类型转为int,虚拟机并没有做实质性的转化处理,只是简单地通过操作数栈交换了两个数据。而将byte转为long时,使用的是i2l,可以看到在内部byte在这里已经等同于int类型处理,类似的还有short类型,这种处理方式有两个特点:
- 一方面可以减少实际的数据类型,如果为short和byte都准备一套指令,那么指令的数量就会大增,而虚拟机目前的设计上,只愿意使用一个字节表示指令,因此指令总数不能超过256个,为了节省指令资源,将short和byte当做int处理也在情理之中。
- 另一方面,由于局部变量表中的槽位固定为32位,无论是byte或者short存入局部变量表,都会占用32位空间。从这个角度说,也没有必要特意区分这几种数据类型。
例子:
1 2 3 4 5 6 7 8
| public class ClassCastTest { public static void main(String[] args) { byte b = 1; int i = b; long l = b; double d = b; } }
|
1 2 3 4 5 6 7 8 9 10 11
| 0 iconst_1 1 istore_1 2 iload_1 3 istore_2 4 iload_1 5 i2l 6 lstore_3 7 iload_1 8 i2d 9 dstore 5 11 return
|
4.2 窄化类型转换
- Java虚拟机支持以下窄化类型转换:
- 从int类型至byte、short或者char类型。对应的指令有:i2b、i2c、i2s。
- 从long类型到int类型。对应的指令有:l2i。
- 从float类型到int或者long类型。对应的指令有:f2i、f2l。
- 从double类型到int、long或者float类型。对应的指令有:d2i、d2l、d2f。
例子:
1 2 3 4 5 6 7 8 9 10 11 12
| public class ClassCastTest { public static void main(String[] args) { int i = 10; byte b = (byte)i; short s = (short)i; char c = (char)i;
long l = 10L; int i1 = (int)l; byte b1 = (byte) l; } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| 0 bipush 10 2 istore_1 3 iload_1 4 i2b 5 istore_2 6 iload_1 7 i2s 8 istore_3 9 iload_1 10 i2c 11 istore 4 13 ldc2_w #2 <10> 16 lstore 5 18 lload 5 20 l2i 21 istore 7 23 lload 5 25 l2i 26 i2b //由于没有l2b的指令,所以要通过l2i、i2b两个指令完成long到byte的转换。 27 istore 8 29 return
|
- 精度损失问题
- 窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级,因此,转换过程很可能会致数值丢失精度。
- 尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况,但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常。
例子:
1 2 3 4 5 6 7
| public class ClassCastTest { public static void main(String[] args) { int i = 128; byte b = (byte)i; System.out.println(b); } }
|
- 当将一个浮点值窄化转换为整数类型T(T限于int或long类型之一)的时候,将遵循以下转换规则:
- 如果浮点值是NaN,那转换结果就是int或long类型的0。
- 如果浮点值不是无穷大的话,浮点值使用IEEE754的向零舍入模式取整,获得整数值v,如果v在目标类型T(int或long)的表示范围之内,那转换结果就是v。否则,将根据v的符号,转换为T所能表示的最大或者最小正数.
- 当将一个double类型窄化转换为float类型时,将遵循以下转换规则:
- 如果转换结果的绝对值太小而无法使用float来表示,将返回float类型的正负零。
- 如果转换结果的绝对值太大而无法使用float来表示,将返回float类型的正负无穷大。
- 对于double类型的NaN值将按规定转换为float类型的NaN值。
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| public class ClassCastTest { public static void main(String[] args) { double d1 = Double.NaN; int i = (int)d1; System.out.println(d1); System.out.println(i);
double d2 = Double.POSITIVE_INFINITY; long l = (long)d2; int j = (int)d2; System.out.println(l); System.out.println(Long.MAX_VALUE); System.out.println(j); System.out.println(Integer.MAX_VALUE);
float f = (float)d2; System.out.println(f);
float f1 = (float)d1; System.out.println(f1); } }
|
5、对象的创建与访问指令
- Java是面向对象的程序设计语言,虚拟机平台从字节码层面就对面向对象做了深层次的支持。有一系列指令专门用于对象操作,可进一步细分为创建指令、字段访问指令、数组操作指令、类型检查指令。
5.1 创建指令
- 虽然类实例和数组都是对象,但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令:
- 创建类实例的指令:new。
- 它接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入栈。
- 创建数组的指令:newarray、anewarray、multianewarray。
- newarray:创建基本类型数组
- anewarray:创建引用类型数组
- multianewarray:创建多维数组
例子1:
1 2 3 4 5 6
| public class ClassCastTest { public static void main(String[] args) { Object obj = new Object(); File file = new File("test.txt"); } }
|
1 2 3 4 5 6 7 8 9 10
| 0 new #2 <java/lang/Object> //创建Object类型的对象,并将对象引用(地址值)压栈 3 dup //在操作数栈中复制一份地址引用 4 invokespecial #1 <java/lang/Object.<init>> //执行Object类的构造方法,此时栈顶的一个复制品出栈 7 astore_1 //将栈顶的地址引用赋值给局部变量表索引为1的位置 8 new #3 <java/io/File> //创建File类型的对象,并将对象引用(地址值)压栈 11 dup //在操作数栈中复制一份地址引用 12 ldc #4 <test.txt> //将字符串的地址值压栈 14 invokespecial #5 <java/io/File.<init>> //执行File类的构造方法,此时栈顶的字符串和一个复制品都会出栈 17 astore_2 //将栈顶的地址引用赋值给局部变量表索引为2的位置 18 return
|
例子2:
1 2 3 4 5 6 7 8 9
| public class ClassCastTest { public static void main(String[] args) { int[] intArray = new int[10]; Object[] objArray = new Object[10]; int[][] mintArray = new int[10][10];
String[][] strArray = new String[10][]; } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| 0 bipush 10 2 newarray 10 (int) 4 astore_1 5 bipush 10 7 anewarray #2 <java/lang/Object> 10 astore_2 11 bipush 10 13 bipush 10 15 multianewarray #3 <[[I> dim 2 19 astore_3 20 bipush 10 22 anewarray #4 <[Ljava/lang/String;> 25 astore 4 27 return
|
5.2 字段访问指令
- 对象创建后,就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。
- 访问类字段(static字段,或者称为类变量)的指令:getstatic、putstatic。
- 访问类实例字段(非static字段,或者称为实例变量)的指令:getfield、putfield。
例子:
1 2 3 4 5
| public class ClassCastTest { public static void main(String[] args) { System.out.println("hello"); } }
|
1 2 3 4
| 0 getstatic #2 <java/lang/System.out> 3 ldc #3 <hello> 5 invokevirtual #4 <java/io/PrintStream.println> 8 return
|
例子2:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| public class ClassCastTest { public static void main(String[] args) { Order order = new Order(); order.id = 1001; System.out.println(order.id);
Order.name = "ORDER"; System.out.println(Order.name); } }
class Order{ int id; static String name; }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| 0 new #2 <com/java13/Order> //创建Order类型的对象,并将对象引用(地址值)压栈 3 dup //在操作数栈中复制一份地址引用 4 invokespecial #3 <com/java13/Order.<init>> //执行Order类的构造方法,此时栈顶的一个复制品出栈 7 astore_1 //将栈顶的地址存放在局部变量表索引为1的位置 8 aload_1 //将局部变量表索引为1的位置的地址值重新压栈 9 sipush 1001 //将1001压栈 12 putfield #4 <com/java13/Order.id> //将1001和地址值一起出栈,并调用order.id进行赋值 15 getstatic #5 <java/lang/System.out> //将System.out压栈 18 aload_1 //将局部变量表索引为1的位置的地址值压栈 19 getfield #4 <com/java13/Order.id> //将栈顶的地址值出栈后把order.id的值压栈 22 invokevirtual #6 <java/io/PrintStream.println> //将栈顶的值和System.out一起出栈完成方法调用 25 ldc #7 <ORDER> //将字符串的地址值压栈 27 putstatic #8 <com/java13/Order.name> //将字符串出栈并给Order.name直接赋值 30 getstatic #5 <java/lang/System.out> //将System.out压栈 33 getstatic #8 <com/java13/Order.name> //将Order.name压栈 36 invokevirtual #9 <java/io/PrintStream.println> //将System.out和Order.name出栈并完成方法调用 39 return
|
5.3 数组操作指令
数组操作指令主要有:xastore和xaload令。具体为:
- 把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload。
- 将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、lastore、fastore、dastore、aastore。
即如下表:
数组类型 |
加载指令 |
存储指令 |
byte(boolean) |
baload |
bastore |
char |
caload |
castore |
short |
saload |
sastore |
int |
iaload |
iastore |
long |
laload |
lastore |
float |
faload |
fastore |
double |
daload |
dastore |
reference |
aaload |
aastore |
取数组长度的指令:arraylength,该指令弹出栈顶的数组元素,获取数组的长度,将长度压入栈。
指令xaload表示将数组的元素压栈,比如alcad、caload分别表示压入short数组和char数组。指令xaload在执行时,要求操作数中栈顶元素为数组索引i,栈顶顺位第2个元素为数组引用a,该指令会弹出栈顶这两个元素,并将a[i]重新压入堆栈。
xastore则专门针对数组操作,以iastore为例,它用于给一个int数组的给定索引赋值。在iastore执行前,操作数栈顶需要以此准备3个元素:值、索引、数组引用,iastore会弹出这3个值,并将值赋给数组中指定索引的位置。
例子1:
1 2 3 4 5 6 7 8 9 10
| public class ClassCastTest { public static void main(String[] args) { int[] intArray = new int[10]; intArray[3] = 20; System.out.println(intArray[1]);
boolean[] arr = new boolean[10]; arr[1] = true; } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| 0 bipush 10 //将10压栈 2 newarray 10 (int) //将10出栈并new一个长度为10的int型数组,将其地址值入栈 4 astore_1 //将栈顶的数组地址值存放到局部变量表索引为1的位置 5 aload_1 //将局部变量表索引为1的位置的地址值重新入栈 6 iconst_3 //将3压栈 7 bipush 20 //将20压栈 9 iastore //将20、3和数组地址值依次出栈完成intArray[3] = 20 10 getstatic #2 <java/lang/System.out> //将System.out压栈 13 aload_1 //将局部变量表索引为1的位置的地址值入栈 14 iconst_1 //将1压栈 15 iaload //将1和数组地址值依次出栈,找到intArray[1]的值并入栈 16 invokevirtual #3 <java/io/PrintStream.println> //将intArray[1]的值和System.out出栈完成方法调用 19 bipush 10 //将10入栈 21 newarray 4 (boolean) //将10出栈并new一个长度为10的boolean型数组,将其地址值入栈 23 astore_2 //将栈顶的数组地址值存放到局部变量表索引为2的位置 24 aload_2 //将局部变量表索引为2的位置的地址值重新入栈 25 iconst_1 //将1压栈 26 iconst_1 //将1压栈 27 bastore //将两个1和地址值依次出栈完成arr[1] = true 28 return
|
例子2:
1 2 3 4 5 6
| public class ClassCastTest { public static void main(String[] args) { double[] arr = new double[10]; System.out.println(arr.length); } }
|
1 2 3 4 5 6 7 8
| 0 bipush 10 //将10压栈 2 newarray 7 (double) //将10出栈并new一个长度为10的double型数组,将其地址值入栈 4 astore_1 //将栈顶的数组地址值存放到局部变量表索引为1的位置 5 getstatic #2 <java/lang/System.out> //将System.out压栈 8 aload_1 //将局部变量表索引为1的位置的地址值入栈 9 arraylength //将栈顶数组地址值出栈并获取数组长度后将数组长度入栈 10 invokevirtual #3 <java/io/PrintStream.println> //将数组长度和System.out出栈完成方法调用 13 return
|
5.4 类型检查指令
- 检查类实例或数组类型的指令:instanceof、checkcast。
- 指令checkcast用于检查类型强制转换是否可以进行。如果可以进行,那么checkcast指令不会改变操作数栈,否则它会抛出ClassCastException异常。
- 指令instanceof用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈(true或者false)。
例子:
1 2 3 4 5 6 7 8 9
| public class ClassCastTest { public String checkCast(Object obj) { if (obj instanceof String) { return (String) obj; } else { return null; } } }
|
1 2 3 4 5 6 7 8
| 0 aload_1 //将obj入栈 1 instanceof #2 <java/lang/String> //obj出栈,判断obj是否是String的实例 4 ifeq 12 (+8) 7 aload_1 //将obj入栈 8 checkcast #2 <java/lang/String> //将obj转换成String类型 11 areturn 12 aconst_null 13 areturn
|
6、方法调用与返回指令
6.1 方法调用指令
6.2 方法返回指令
- 方法调用结束前,需要进行返回。方法返回指令是根据返回值的类型区分的。
- 包括ireturn(当返回值是boolean、byte、char、short和int 类型时使用)、lreturn、freturn、dreturn和areturn。
- 另外还有一条return指令供声明为void的方法、实例初始化方法以及类和接口的类初始化方法使用。
- 通过ireturn指令,将当前函数操作数栈的顶层元素弹出,并将这个元素压入调用者函数的操作数栈中(因为调用者非常关心函数的返回值),所有在当前函数操作数栈中的其他元素都会被丢弃。
- 如果当前返回的是synchronized方法,那么还会执行一个隐含的monitorexit指令,退出临界区。
- 最后,会丢弃当前方法的整个帧,恢复调用者的帧,并将控制权转交给调用者。
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
| public class MethodInvokeReturnTest { public MethodInvokeReturnTest(){
}
public int returnInt(){ int i = 500; return i; } public double returnDouble(){ return 0.0; }
public String returnString(){ return "hello,world"; } public int[] returnArr(){ return null; }
public float returnFloat(){ int i = 10; return i; } public byte returnByte(){ return 0; }
public void methodReturn(){ int i = returnByte(); } }
|
7、操作数栈管理指令
- 如同操作一个普通数据结构中的堆栈那样,JVM提供的操作数栈管理指令,可以用于直接操作操作数栈的指令。
- 这类指令包括如下内容:
- 将一个或两个元素从栈顶弹出,并且直接废弃:pop,pop2。
- 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup,dup2,dup_x1,dup2_×1,dup_×2,dup2_×2。
- 不带_x的指令是复制栈顶数据并压入栈顶。包括两个指令,dup和dup2。dup的系数代表要复制的Slot个数。
- dup开头的指令用于复制1个slot的数据。例如1个int或1个reference类型数据。
- dup2开头的指令用于复制2个slot的数据。例如1个long,或2个int,或1个int+1个float类型数据。
- 带_x的指令是复制栈顶数据并插入栈顶以下的某个位置。共有4个指令,dup_×1,dup2_×1,dup_×2,dup2_×2。对于带_x的复制插入指令,只要将指令的dup和x的系数相加,结果即为需要插入的位置。
- dup_×1插入位置:1+1=2,即栈顶2个slot下面。
- dup_×2插入位置:1+2=3,即栈顶3个slot下面。
- dup2_×1插入位置:2+1=3,即栈顶3个slot下面。
- dup2_×2插入位置:2+2=4,即栈顶4个slot下面。
- 将栈最顶端的两个slot数值位置交换:swap。Java虚拟机没有提供交换两个64位数据类型(
long、double)数值的指令。
- 指令nop,是一个非常特殊的指令,它的字节码为0x00。和汇编语言中的nop一样,它表示什么都不做。这条指令一般可用于调试、占位等。
- 这些指令属于通用型,对栈的压入或者弹出无需指明数据类型。
例子1:
1 2 3 4 5 6
| public class StackOperateTest { public void print(){ Object obj = new Object(); String info = obj.toString(); } }
|
1 2 3 4 5 6 7 8
| 0 new #2 <java/lang/Object> //创建Object类型的对象,并将对象引用(地址值)压栈 3 dup //在操作数栈中复制一份地址引用 4 invokespecial #1 <java/lang/Object.<init>> //栈顶的一个复制品出栈,执行Object类的构造方法 7 astore_1 //将栈顶的地址值保存在局部变量表索引为1的位置 8 aload_1 //将局部变量表索引为1的位置的值压栈 9 invokevirtual #3 <java/lang/Object.toString> //栈顶的地址值出栈并执行toString方法,并将返回值压栈 12 astore_2 //栈顶数据出栈并保存在局部变量表索引为2的位置 13 return
|
如果改成以下代码:
1 2 3 4 5 6
| public class StackOperateTest { public void print(){ Object obj = new Object(); obj.toString(); } }
|
会发现指令变成如下,唯一的不同是astore_2变成了pop,原因是此时obj.toString()返回的值用不到了,所以要弹栈。
1 2 3 4 5 6 7 8
| 0 new #2 <java/lang/Object> 3 dup 4 invokespecial #1 <java/lang/Object.<init>> 7 astore_1 8 aload_1 9 invokevirtual #3 <java/lang/Object.toString> 12 pop 13 return
|
例子2:
1 2 3 4 5 6 7 8
| public class StackOperateTest { public void foo(){ bar(); } public long bar(){ return 0; } }
|
其中foo()的字节码指令如下,可以发现在调用bar()返回的是一个8个字节的long类型数据,并且用不到,所以要用pop2指令弹栈:
1 2 3 4
| 0 aload_0 1 invokevirtual #2 <com/java13/StackOperateTest.bar> 4 pop2 5 return
|
例子3:
1 2 3 4 5 6 7
| public class StackOperateTest { public long nextIndex() { return index++; }
private long index = 0; }
|
1 2 3 4 5 6 7 8
| 0 aload_0 //将局部变量表索引为0位置的当前对象的地址值压栈 1 dup //在操作数栈中复制一份地址引用 2 getfield #2 <com/java13/StackOperateTest.index> //复制品出栈,返回index的值压栈 5 dup2_x1 //将栈顶的index(占用两个slot)复制一份插入到栈顶3个slot下面 6 lconst_1 //将1压栈 7 ladd //将index的值和1弹栈并做相加后压栈 8 putfield #2 <com/java13/StackOperateTest.index> //将1和当前对象的地址值一起出栈并将StackOperateTest.index赋值为1,即完成自增操作 11 lreturn //将栈顶的0返回
|
8、控制转移指令
- 程序流程离不开条件控制,为了支持条件跳转,虚拟机提供了大量字节码指令,大体上可以分为:
- 比较指令
- 条件跳转指令
- 比较条件跳转指令
- 多条件分支跳转指令
- 无条件跳转指令等
8.1 条件跳转指令
- 条件跳转指令通常和比较指令结合使用。在条件跳转指令执行前,一般可以先用比较指令进行栈顶元素的准备,然后进行条件跳转。
- 条件跳转指令有:ifeq,iflt,ifle,ifne,ifgt,ifge,ifnull,ifnonnull。这些指令都接收两个字节的操作数,用于计算跳转的位置(16位符号整数作为当前位置的offset)。
- 它们的统一含义为:弹出栈顶元素,测试它是否满足某一条件,如果满足条件,则跳转到给定位置。
指令 |
描述 |
ifeq |
当栈顶int类型数值等于0时跳转 |
ifne |
当栈顶int类型数值不等于0时跳转 |
iflt |
当栈顶int类型数值小于0时跳转 |
ifle |
当栈顶int类型数值小于等于0时跳转 |
ifgt |
当栈顶int类型数值大于0时跳转 |
ifge |
当栈顶int类型数值大于等于0时跳转 |
ifnull |
为null时跳转 |
ifnonnull |
不为null时跳转 |
- 与前面运算规则一致:
- 对于boolean、byte、char、short类型的条件分支比较操作,都是使用int类型的比较指令完成。
- 对于long、float、double类型的条件分支比较操作,则会先执行相应类型的比较运算指令,运算指令会返回一个整型值到操作数栈中,随后再执行int类型的条件分支比较操作来完成整个分支跳转。
例子1:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| public class IfSwitchGotoTest { public void compare1(){ int a = 0; if(a != 0){ a = 10; }else{ a = 20; } } public boolean compareNull(String str){ if(str == null){ return true; }else{ return false; } } }
|
compare1()的字节码指令:
1 2 3 4 5 6 7 8 9 10
| 0 iconst_0 1 istore_1 2 iload_1 3 ifeq 12 (+9) //栈顶数据出栈并判断其是否等于0,如果是则跳转到第12行指令继续执行 6 bipush 10 8 istore_1 9 goto 15 (+6) //无条件跳转到第15行指令,即返回 12 bipush 20 14 istore_1 15 return
|
compareNull()的字节码指令:
1 2 3 4 5 6
| 0 aload_1 1 ifnonnull 6 (+5) //栈顶数据出栈并判断其是否不等于null,如果是则跳转到第6行指令继续执行 4 iconst_1 5 ireturn 6 iconst_0 7 ireturn
|
例子2:
1 2 3 4 5 6 7 8 9 10 11 12 13
| public class IfSwitchGotoTest { public void compare1() { float f1 = 9; float f2 = 10; System.out.println(f1 < f2); } public void compare2() { int i1 = 10; long l1 = 20; System.out.println(i1 > l1); } }
|
compare1() 的字节码指令:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| 0 ldc #2 <9.0> //将9.0入栈 2 fstore_1 //栈顶数据保存到局部变量表索引为1的位置 3 ldc #3 <10.0> //将10.0入栈 5 fstore_2 //栈顶数据保存到局部变量表索引为2的位置 6 getstatic #4 <java/lang/System.out> //System.out入栈 9 fload_1 //局部变量表索引为1的位置的值(9.0)入栈 10 fload_2 //局部变量表索引为2的位置的值(10.0)入栈 11 fcmpg //将10.0和9.0依次出栈进行比较发现9.0<10.0,所以将-1压栈 12 ifge 19 (+7) //将-1出栈并判断它是否大于等于0,如果是则跳转到第19行指令继续执行 15 iconst_1 //将1入栈 16 goto 20 (+4) 19 iconst_0 //将0入栈 20 invokevirtual #5 <java/io/PrintStream.println> //将0或1出栈并调用方法打印结果 23 return
|
compare2() 的字节码指令:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| 0 bipush 10 2 istore_1 3 ldc2_w #6 <20> 6 lstore_2 7 getstatic #4 <java/lang/System.out> 10 iload_1 11 i2l //将栈顶的int类型转化成long类型后入栈,此时占两个slot 12 lload_2 13 lcmp //将20和10依次出栈进行比较发现10<20,所以将-1压栈 14 ifle 21 (+7) //将-1出栈并判断它是否小于等于0,如果是则跳转到第21行指令继续执行 17 iconst_1 18 goto 22 (+4) 21 iconst_0 22 invokevirtual #5 <java/io/PrintStream.println> 25 return
|
- 总结:比较指令主要针对long、float、double三类,比较完之后返回-1、0或者1,之后再用条件跳转指令;而如果本身是byte、short、char、boolean、int,则直接用条件跳转指令即可。
8.2 比较条件跳转指令
- 比较条件跳转指令类似于比较指令和条件跳转指令的结合体,它将比较和跳转两个步骤合二为一。这类指令有:if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq和if_acmpne。
- 其中指令助记符加上“if_”后,以字符“i”开头的指令针对int型整数操作(也包括short和byte类型),以字符“a”开头的指令表示对象引用的比较。
指令 |
描述 |
if_icmpeq |
比较栈顶两int类型数值大小,当前者等于后者时跳转 |
if_icmpne |
比较栈顶两int类型数值大小,当前者不等于后者时跳转 |
if_icmplt |
比较栈顶两int类型数值大小,当前者小于后者时跳转 |
if_icmple |
比较栈顶两int类型数值大小,当前者小于等于后者时跳转 |
if_icmpgt |
比较栈顶两int类型数值大小,当前者大于后者时跳转 |
if_icmpge |
比较栈顶两int类型数值大小,当前者大于等于后者时跳转 |
if_acmpeq |
比较栈顶两引用类型数值,当结果相等时跳转 |
if_acmpne |
比较栈顶两引用类型数值,当结果不相等时跳转 |
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| public class IfSwitchGotoTest { public void ifCompare1(){ int i = 10; int j = 20; System.out.println(i > j); } public void ifCompare2() { short s1 = 9; byte b1 = 10; System.out.println(s1 > b1); }
public void ifCompare3() { Object obj1 = new Object(); Object obj2 = new Object(); System.out.println(obj1 == obj2); System.out.println(obj1 != obj2); } }
|
ifCompare1()的字节码指令:
1 2 3 4 5 6 7 8 9 10 11 12 13
| 0 bipush 10 2 istore_1 3 bipush 20 5 istore_2 6 getstatic #2 <java/lang/System.out> 9 iload_1 10 iload_2 11 if_icmple 18 (+7) //将20和10依次出栈并判断10是否小于等于20,如果是则跳转到第18行指令继续执行 14 iconst_1 15 goto 19 (+4) 18 iconst_0 19 invokevirtual #3 <java/io/PrintStream.println> 22 return
|
ifCompare2()的字节码指令如下,发现short和byte的比较也是用if_icmple:
1 2 3 4 5 6 7 8 9 10 11 12 13
| 0 bipush 9 2 istore_1 3 bipush 10 5 istore_2 6 getstatic #2 <java/lang/System.out> 9 iload_1 10 iload_2 11 if_icmple 18 (+7) 14 iconst_1 15 goto 19 (+4) 18 iconst_0 19 invokevirtual #3 <java/io/PrintStream.println> 22 return
|
ifCompare3()的字节码指令:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
| 0 new #4 <java/lang/Object> 3 dup 4 invokespecial #1 <java/lang/Object.<init>> 7 astore_1 8 new #4 <java/lang/Object> 11 dup 12 invokespecial #1 <java/lang/Object.<init>> 15 astore_2 16 getstatic #2 <java/lang/System.out> 19 aload_1 20 aload_2 21 if_acmpne 28 (+7) //将obj2和obj1依次出栈并判断obj1!=obj2是否成立,如果成立则跳转到第28行指令继续执行 24 iconst_1 25 goto 29 (+4) 28 iconst_0 29 invokevirtual #3 <java/io/PrintStream.println> 32 getstatic #2 <java/lang/System.out> 35 aload_1 36 aload_2 37 if_acmpeq 44 (+7) //将obj2和obj1依次出栈并判断obj1==obj2是否成立,如果成立则跳转到第44行指令继续执行 40 iconst_1 41 goto 45 (+4) 44 iconst_0 45 invokevirtual #3 <java/io/PrintStream.println> 48 return
|
8.3 多条件分支跳转
- 多条件分支跳转指令是专为switch-case语句设计的,主要有tableswitch和lookupswitch。
指令名称 |
描述 |
tableswitch |
用于switch条件跳转,case值连续 |
lookupswitch |
用于switch条件跳转,case值不连续 |
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
| public class IfSwitchGotoTest { public void switch1(int select){ int num; switch(select){ case 1: num = 10; break; case 2: num = 20; case 3: num = 30; break; default: num = 40; }
} public void switch2(int select){ int num; switch(select){ case 100: num = 10; break; case 500: num = 20; break; case 200: num = 30; break; default: num = 40; } } public void switch3(String season){ switch(season){ case "SPRING":break; case "SUMMER":break; case "AUTUMN":break; case "WINTER":break; } } }
|
switch1()的字节码指令:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| 0 iload_1 1 tableswitch 1 to 3 1: 28 (+27) //直接利用最高最低和偏移量定位 2: 34 (+33) 3: 37 (+36) default: 43 (+42) 28 bipush 10 30 istore_2 31 goto 46 (+15) 34 bipush 20 36 istore_2 37 bipush 30 39 istore_2 40 goto 46 (+6) 43 bipush 40 45 istore_2 46 return
|
switch2()的字节码指令:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| 0 iload_1 1 lookupswitch 3 //从上往下匹配 100: 36 (+35) 200: 48 (+47) 500: 42 (+41) default: 54 (+53) 36 bipush 10 38 istore_2 39 goto 57 (+18) 42 bipush 20 44 istore_2 45 goto 57 (+12) 48 bipush 30 50 istore_2 51 goto 57 (+6) 54 bipush 40 56 istore_2 57 return
|
switch3()的字节码指令:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
| 0 aload_1 1 astore_2 2 iconst_m1 3 istore_3 4 aload_2 5 invokevirtual #2 <java/lang/String.hashCode> 8 lookupswitch 4 //将形参的hashcode分别与case处的hashcode比较 -1842350579: 52 (+44) -1837878353: 66 (+58) -1734407483: 94 (+86) 1941980694: 80 (+72) default: 105 (+97) 52 aload_2 53 ldc #3 <SPRING> 55 invokevirtual #4 <java/lang/String.equals> //如果hashcode相同再用equals比较 58 ifeq 105 (+47) 61 iconst_0 62 istore_3 63 goto 105 (+42) 66 aload_2 67 ldc #5 <SUMMER> 69 invokevirtual #4 <java/lang/String.equals> 72 ifeq 105 (+33) 75 iconst_1 76 istore_3 77 goto 105 (+28) 80 aload_2 81 ldc #6 <AUTUMN> 83 invokevirtual #4 <java/lang/String.equals> 86 ifeq 105 (+19) 89 iconst_2 90 istore_3 91 goto 105 (+14) 94 aload_2 95 ldc #7 <WINTER> 97 invokevirtual #4 <java/lang/String.equals> 100 ifeq 105 (+5) 103 iconst_3 104 istore_3 105 iload_3 106 tableswitch 0 to 3 0: 136 (+30) 1: 139 (+33) 2: 142 (+36) 3: 145 (+39) default: 145 (+39) 136 goto 145 (+9) 139 goto 145 (+6) 142 goto 145 (+3) 145 return
|
8.4 无条件跳转指令
- 目前主要的无条件跳转指令为goto。指令goto接收两个字节的操作数,共同组成一个带符号的整数,用于指定指令的偏移量,指令执行的目的就是跳转到偏移量给定的位置处。
- 如果指令偏移量太大,超过双字节的带符号整数的范围,则可以使用指令goto_w,它和goto有相同的作用,但是它接收4个字节的操作数,可以表示更大的地址范围。
- 指令jsr、jsr_w、ret虽然也是无条件跳转的,但主要用于try-finally语句,且已经被虚拟机逐渐废弃,故不在这里介绍这两个指令。
指令名称 |
描述 |
goto |
无条件跳转 |
goto_w |
无条件跳转(宽索引) |
jsr |
跳转至指定16位offset位置,并将jsr下一条指令地址压入栈顶 |
jsr_w |
跳转至指定32位offset位置,并将jsr_w下一条指令地址压入栈顶 |
ret |
返回至由指定的局部变量所给出的指令位置(一般与jsr、jsr_w联合使用) |
9、异常处理指令
9.1 抛出异常指令
- athrow指令
- 在Java程序中显示抛出异常的操作(throw语句)都是由athrow指令来实现。
- 除了使用throw语句显示抛出异常情况之外,JVM规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出。例如,在之前介绍的整数运算时,当除数为零时,虚拟机会在idiv或ldiv指令中抛出ArithmeticException异常。
- 正常情况下,操作数栈的压入弹出都是一条条指令完成的。唯一的例外情况是在抛异常时,Java虚拟机会清除操作数栈上的所有内容,而后将异常实例压入调用者操作数栈上。
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| public class ExceptionTest { public void throwZero(int i){ if(i == 0){ throw new RuntimeException("参数值为0"); } } public void throwOne(int i) throws RuntimeException{ if(i == 1){ throw new RuntimeException("参数值为1"); } } public void throwArithmetic() { int i = 10; int j = i / 0; System.out.println(j); } }
|
throwZero()对应的字节码指令:
1 2 3 4 5 6 7 8
| 0 iload_1 1 ifne 14 (+13) 4 new #2 <java/lang/RuntimeException> 7 dup 8 ldc #3 <参数值为0> 10 invokespecial #4 <java/lang/RuntimeException.<init>> 13 athrow //抛出后此方法对应栈帧结束,接着把此异常对象放到调用者对应栈帧的操作数栈中 14 return
|
throwOne()对应的字节码指令如下,基本和上面没什么区别,但是会发现多了个和code属性并列的异常属性,说明code属性是用来刻画方法体的,而throws是在方法的声明处,是用来刻画方法的,所以是另外一个属性:
1 2 3 4 5 6 7 8 9
| 0 iload_1 1 iconst_1 2 if_icmpne 15 (+13) 5 new #2 <java/lang/RuntimeException> 8 dup 9 ldc #5 <参数值为1> 11 invokespecial #4 <java/lang/RuntimeException.<init>> 14 athrow 15 return
|
throwArithmetic()对应的字节码指令如下,可以发现由于数学异常是虚拟机定义好的异常,所以在字节码指令中找不到任何throw指令。
1 2 3 4 5 6 7 8 9 10
| 0 bipush 10 2 istore_1 3 iload_1 4 iconst_0 5 idiv 6 istore_2 7 getstatic #6 <java/lang/System.out> 10 iload_2 11 invokevirtual #7 <java/io/PrintStream.println> 14 return
|
9.2 异常处理和异常表
- 在Java虚拟机中,处理异常(catch语句)不是由字节码指令来实现的(早期使用jsr、ret指令),而是采用异常表来完成的。
- 如果一个方法定义了一个try-catch或者try-finally的异常处理,就会创建一个异常表。它包含了每个异常处理或者finally块的信息。异常表保存了每个异常处理信息。比如:
- 起始位置
- 结束位置
- 程序计数器记录的代码处理的偏移地址
- 被捕获的异常类在常量池中的索引
- 当一个异常被抛出时,JVM会在当前的方法里寻找一个匹配的处理,如果没有找到,这个方法会强制结束并弹出当前栈帧,并且异常会重新抛给上层调用的方法(在调用方法栈帧)。如果在所有栈帧弹出前仍然没有找到合适的异常处理,这个线程将终止。如果这个异常在最后一个非守护线程里抛出,将会导致JVM自己终止,比如这个线程是个main线程。
- 不管什么时候抛出异常,如果异常处理最终匹配了所有异常类型,代码就会继续执行。在这种情况下,如果方法结束后没有抛出异常,仍然执行finally块,在return前,它直接跳到finally块来完成目标。
例子1:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| public class ExceptionTest { public void tryCatch() { try { File file = new File("d:/hello.txt"); FileInputStream fis = new FileInputStream(file);
String info = "hello!"; } catch (FileNotFoundException e) { e.printStackTrace(); } catch (RuntimeException e) { e.printStackTrace(); } } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| 0 new #2 <java/io/File> 3 dup 4 ldc #3 <d:/hello.txt> 6 invokespecial #4 <java/io/File.<init>> 9 astore_1 10 new #5 <java/io/FileInputStream> 13 dup 14 aload_1 15 invokespecial #6 <java/io/FileInputStream.<init>> 18 astore_2 19 ldc #7 <hello!> 21 astore_3 22 goto 38 (+16) 25 astore_1 //出现异常时异常对象会先入栈,这里是把异常对象的地址存到局部变量表索引为1的位置 26 aload_1 27 invokevirtual #9 <java/io/FileNotFoundException.printStackTrace> 30 goto 38 (+8) 33 astore_1 34 aload_1 35 invokevirtual #11 <java/lang/RuntimeException.printStackTrace> 38 return
|
字节码文件中有个异常表,分别记录了不同异常的处理返回:
例子2:
1 2 3 4 5 6 7 8 9 10 11
| public class ExceptionTest { public static String func() { String str = "hello"; try{ return str; } finally{ str = "perfectcode.top"; } } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13
| 0 ldc #2 <hello> //字符串的地址入栈 2 astore_0 //栈顶数值存到局部变量表索引为0的位置 3 aload_0 //局部变量表索引为1的位置的值入栈 4 astore_1 //栈顶数值存到局部变量表索引为1的位置(这里相当于把原来的地址复制了一份) 5 ldc #3 <perfectcode.top> //另一个字符串的地址入栈 7 astore_0 //栈顶数值存到局部变量表索引为0的位置(这里相当于新的字符串地址覆盖了原地址) 8 aload_1 //局部变量表索引为1的位置的值(旧的字符串地址)入栈 9 areturn 10 astore_2 //如果出现异常会提前把异常对象入栈,这里是把异常对象的地址存到局部变量表索引为2的位置 11 ldc #3 <perfectcode.top> 13 astore_0 14 aload_2 15 athrow
|
异常表如下:
10、同步控制指令
- java虚拟机支持两种同步结构:方法级的同步和方法内部一段指令序列的同步,这两种同步都是使用monitor来支持的。
10.1 方法的同步
- 方法级的同步:是隐式的,即无须通过字节码指令来控制,它实现在方法调用和返回操作之中。虚拟机可以从方法常量池的方法表结构中的ACC_SYNCHRONIZED访问标志得知一个方法是否声明为同步方法。
- 当调用方法时,调用指令将会检查方法的ACC_SYNCHRONIZED访问标志是否设置。
- 如果设置了,执行线程将先持有同步锁,然后执行方法。最后在方法完成(无论是正常完成还是非正常完成)时释放同步锁。
- 在方法执行期间,执行线程持有了同步锁,其他任何线程都无法再获得同一个锁。
- 如果一个同步方法执行期间抛出了异常,并且在方法内部无法处理此异常,那这个同步方法所持有的锁将在异常抛到同步方法之外时自动释放。
例子:
1 2 3 4 5 6
| public class SynchronizedTest { private int i = 0; public synchronized void add(){ i++; } }
|
这段代码和普通的无同步操作的代码没有什么不同,没有使用monitorenter和monitorexit进行同步区控制。这是因为,对于同步方法而言,当虚拟机通过方法的访问标示符判断是一个步方法时,会自动在方法调用前进行加锁,当同步方法执行完毕后,不管方法是正常结束还是有异常抛出,均会由虚拟机释放这个锁。因此,对于同步方法而言,monitorenter和nonitorexit指令是隐式存在的,并未直接出现在字节码中。
1 2 3 4 5 6 7
| 0 aload_0 1 dup 2 getfield #2 <com/java13/SynchronizedTest.i> 5 iconst_1 6 iadd 7 putfield #2 <com/java13/SynchronizedTest.i> 10 return
|
从字节码指令中看不出此方法的任何与synchronized有关的指令,因此是隐式的,相关描述是存放在方法的访问标志中的,如图:
10.2 方法内指定指令序列的同步
- 同步一段指令集序列:通常是由java中的synchronized语句块来表示的。jvm的指令集有monitorenter和monitorexit 两条指令来支持synchronized关键字的语义。
- 当一个线程进入同步代码块时,它使用monitorenter指令请求进入。如果当前对象的监视器计数器为0,则它会被准许进入若为1,则判断持有当前监视器的线程是否为自己,如果是,则进入,否则进行等待,直到对象的监视器计数器为0,才会被允许进入同步块。
- 当线程退出同步块时,需要使用monitorexit声明退出。在Java虚拟机中,任何对象都有一个监视器与之相关联,用来判断对象是否被锁定,当监视器被持有后,对象处于锁定状态。
- 指令monitorenter和monitorexit在执行时,都需要在操作数栈顶压入对象,之后monitorenter和monitorexit的锁定和释放都是针对这个对象的监视器进行的。
例子:
1 2 3 4 5 6 7 8 9
| public class SynchronizedTest { private int i = 0; private Object obj = new Object(); public void subtract(){ synchronized (obj){ i--; } } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| 0 aload_0 1 getfield #4 <com/java13/SynchronizedTest.obj> 4 dup 5 astore_1 6 monitorenter //如果同步监视器obj的计数器为0,则obj出栈并把计数器改为1 7 aload_0 8 dup 9 getfield #2 <com/java13/SynchronizedTest.i> 12 iconst_1 13 isub 14 putfield #2 <com/java13/SynchronizedTest.i> 17 aload_1 //将局部变量表索引为1位置的obj的地址入栈 18 monitorexit //obj出栈并把计数器重新改成0 19 goto 27 (+8) 22 astore_2 //将异常对象出栈并保存到局部变量表索引为2的位置 23 aload_1 24 monitorexit //将同步监视器obj的计数器改成0 25 aload_2 //将异常对象重新压栈 26 athrow //弹出异常对象并throw给方法的调用者 27 return
|
会发现有个异常表,用来当同步代码块里出现异常时,将同步监视器obj的计数器重新设置为0,以便其它线程能正常进入: