第50篇-调用约定(2)
前面已经介绍了解释执行的Java方法、编译执行的Java方法和native方法的调用约定。这一篇我们看一下HotSpot VM中辅助实现调用约定的相关函数。
1、SharedRuntime::java_calling_convention()函数
当需要编译执行Java方法时,会调用SharedRuntime::java_calling_convention()函数,此函数的实现如下:
int SharedRuntime::java_calling_convention(
const BasicType *sig_bt, // sig_bt相当于是数组
VMRegPair *regs,
int total_args_passed,
int is_outgoing // 值一般为false
) {
// Register的类型为RegisterImpl*,而VMReg的类型为VMRegImpl*
// 通过数组来将相关的参数存储到对应的寄存器上
static const Register INT_ArgReg[Argument::n_int_register_parameters_j] =
{
j_rarg0, // 6
j_rarg1, // 2
j_rarg2, // 1
j_rarg3, // 8
j_rarg4, // 9
j_rarg5 // 7
};
static const XMMRegister FP_ArgReg[Argument::n_float_register_parameters_j] =
{
j_farg0, // 0
j_farg1, // 1
j_farg2, // 2
j_farg3, // 3
j_farg4, // 4
j_farg5, // 5
j_farg6, // 6
j_farg7 // 7
};
// ...
}
在调用如上函数时,会传入表示Java方法参数的类型数组sig_bt,总的参数数量total_args_passed。我们将要传递参数使用的寄存器和栈slot通过regs数组来保存。其中的BasicType枚举类的定义如下:
enum BasicType {
T_BOOLEAN = 4,
T_CHAR = 5,
T_FLOAT = 6,
T_DOUBLE = 7,
T_BYTE = 8,
T_SHORT = 9,
T_INT = 10,
T_LONG = 11,
T_OBJECT = 12,
T_ARRAY = 13,
T_VOID = 14,
T_ADDRESS = 15, // t_address ret指令用到的表示返回地址的returnAddress类型
T_NARROWOOP = 16, // t_narrowoop
T_METADATA = 17, // t_metadata
T_NARROWKLASS = 18, // t_narrowklass
T_CONFLICT = 19, // t_conflict for stack value type with conflicting contents
T_ILLEGAL = 99 // t_illegal
};
如上枚举类中定义的类型已经足够表示Java字节码中的任何类型了,所以Java方法中的类型会统一使用如上枚举类来表示。
VMRegPair类的定义如下:
class VMRegPair {
private:
VMReg _second;
VMReg _first;
public:
void set_bad () {
_second=VMRegImpl::Bad();
_first=VMRegImpl::Bad();
}
void set1 (VMReg v) {
_second=VMRegImpl::Bad(); // 值为-1
_first=v;
}
void set2 (VMReg v) {
_second=v->next(); // 就是v的值加1
_first=v;
}
// ...
}
我们看到了这个类中定义了_first和_second这一对寄存器,这主要是为32位实现考虑的,因为32位在传递long或double类型的参数时,需要2个寄存器来完成,一个存储高32位,一个存储低32位。对于64位来说,通过只使用_first寄存器就可完成任务。所以我们在讨论64位实现时,可不用太在意_second属性。
VMRegPair中的_first和_second属性的类型为VMReg。VMReg是VMRegImpl*的别名,定义如下:
typedef VMRegImpl* VMReg;
// 这个类中只有静态属性,并且也没虚函数,所以占用的内存大小为1个字
class VMRegImpl {
private:
enum { BAD = -1 };
static VMReg stack0;
public:
static VMReg as_VMReg(int val, bool bad_ok = false) {
assert(val > BAD || bad_ok, "invalid");
// 一个整数转换为VMRegImpl*,注意VMReg是VMRegImpl*的别名
return (VMReg) (intptr_t) val;
}
static VMReg stack2reg( int idx ) {
intptr_t x = stack0->value(); // x的值为184
return (VMReg) (intptr_t) (x + idx); // stack0->value()的值为184
}
uintptr_t reg2stack() {
return value() - stack0->value();
}
// ...
}
需要注意的是,stack0是VMReg类型,也就是指针类型,指针类型是可以直接和整数相互转换的,所以我们通常会在stack0中存储一个整数。通过判断这个整数,我们能够知道,当前的VMRegImpl实例到底代表的是通用寄存器、浮点寄存器还是栈上的位置。
在C/C++函数中,可将整数转换为指针类型,因为指针类型表示地址,其实地址也是一个数值。举个例子,如下:
// 定义一个空类a,占用的内存空间大小为1
class a{};
int num = 2;
// 将整数转换为指针,这是被允许的
a* res = (a*)num;
直接将一个整数转换为指针类型。但是我们在使用时要记住,这通常不是一个合法的地址。
继续看函数的实现逻辑:
int SharedRuntime::java_calling_convention(
const BasicType *sig_bt, // sig_bt相当于是数组
VMRegPair *regs,
int total_args_passed,
int is_outgoing
) {
// ...
uint int_args = 0;
uint fp_args = 0;
// 如果寄存器使用完,则多出来的参数需要通过栈来传递,这个变量记录需要的
// slot(这里为了考虑32位情况,每个slot是4个字节,所以在64位情况下,
// 每次需要2个slot,所以stk_args每次需要增加2
uint stk_args = 0;
for (int i = 0; i < total_args_passed; i++) {
switch (sig_bt[i]) { // sig_bt[i]的类型为字,当前是64位,8个字节
case T_BOOLEAN:
case T_CHAR:
case T_BYTE:
case T_SHORT:
case T_INT:
// 当小于6个参数时,参数放在寄存器上,n_int_register_parameters_j=6
if (int_args < Argument::n_int_register_parameters_j) {
VMReg tmp = INT_ArgReg[int_args++]->as_VMReg(); // VMReg是VMRegImpl*类型的别名
regs[i].set1(tmp);
} else { // 放在栈上
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set1(tmp);
stk_args += 2;
}
break;
case T_VOID:
// halves of T_LONG or T_DOUBLE
// long和double需要2个slot(这里的slot为8字节)
assert(i != 0 && (sig_bt[i - 1] == T_LONG || sig_bt[i - 1] == T_DOUBLE), "expecting half");
regs[i].set_bad();
break;
case T_LONG:
assert(sig_bt[i + 1] == T_VOID, "expecting half");
case T_OBJECT:
case T_ARRAY:
case T_ADDRESS:
if (int_args < Argument::n_int_register_parameters_j) {
VMReg tmp = INT_ArgReg[int_args++]->as_VMReg();
regs[i].set2(tmp);
} else {
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set2(tmp);
stk_args += 2;
}
break;
case T_FLOAT:
if (fp_args < Argument::n_float_register_parameters_j) {
VMReg tmp = FP_ArgReg[fp_args++]->as_VMReg();
regs[i].set1(tmp);
} else {
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set1(tmp);
stk_args += 2;
}
break;
case T_DOUBLE:
assert(sig_bt[i + 1] == T_VOID, "expecting half");
if (fp_args < Argument::n_float_register_parameters_j) {
VMReg tmp = FP_ArgReg[fp_args++]->as_VMReg();
regs[i].set2(tmp);
} else {
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set2(tmp);
stk_args += 2;
}
break;
default:
ShouldNotReachHere();
break;
}
}
return round_to(stk_args, 2);
}
当类型为非浮点数类型时,通过通用寄存器来传递。通过通用寄存器传递参数时,如果为boolean、byte、short、char和int时,调用VMRegPair::set1()函数,否则调用VMRegPair::set2()函数。对于64位来说,我们不需要关注VMRegPair::_second属性的值,所以我们只关心_first参数的值即可。
最终会在regs数组中存储与参数个数相同的VMRegPair个实例,我们总结一下:
(1)当存储T_BOOLEAN、T_BYTE、T_SHORT、T_CHAR和T_INT时,_first的值小于32,表示使用通用寄存器来传递参数;
(2)当存储T_OBJECT、T_ARRAY、T_ADDRESS和T_LONG类型时,_first的值是仍然小于32,表示使用通用寄存器来传递参数;
(3)当存储T_FLOAT和T_DOUBLE时,_first的值大于等于48,小于148,表示使用浮点寄存器来传递参数;
(4)当存储的_first的值大于等于148时,表示对应的参数需要通过栈来传递;
(5)当_first的值为其它时,非法;
只有在寄存器用完后才会通过栈来传递参数,所以要通过stk_args来统计需要开辟多大的栈空间。举个例子如下:
public static native void arraycopy(Object src, int srcPos,
Object dest, int destPos,
int length);
本地方法共有5个参数,所以可以通过前5个寄存器来传递参数。函数入参为:
const int total_args_passed=5 BasicType* sig_bbt=[T_OBJECT,T_INT,T_INT,T_OBJECT,T_INT,T_INT]
最终stk_args为0,而regs的值如下:
VMRegPair* in_regs=[ VMRegPair(_first=6*2,_second=13) // 传递的是T_OBJECT VMRegPair(_first=2*2,_second=-1) VMRegPair(_first=1*2,_second=-1) VMRegPair(_first=8*2,_second=17) // 传递的是T_OBJECT VMRegPair(_first=9*2,_second=-1) ]
我们可以通过判断_first的值来区分出浮点类型与其它剩余类型。由于如上的5个参数都是通过通用寄存器传递的,所以_first的值都小于32。
2、SharedRuntime::c_calling_convention()函数
调用的函数的实现如下:
int SharedRuntime::c_calling_convention(
const BasicType *sig_bt,
VMRegPair *regs,
int total_args_passed
){ // 共需要向C传递的参数数量
// Register的定义为RegisterImpl*
static const Register INT_ArgReg[Argument::n_int_register_parameters_c] = {
c_rarg0, // 0x7
c_rarg1, // 0x6
c_rarg2, // 0x2
c_rarg3, // 0x1
c_rarg4, // 0x8
c_rarg5 // 0x9
};
static const XMMRegister FP_ArgReg[Argument::n_float_register_parameters_c] = {
c_farg0,
c_farg1,
c_farg2,
c_farg3,
c_farg4,
c_farg5,
c_farg6,
c_farg7
};
uint int_args = 0;
uint fp_args = 0;
uint stk_args = 0; // inc by 2 each time
// 参数优先向寄存器中分配,如果没有寄存器时再向栈中分配
for (int i = 0; i < total_args_passed; i++) {
switch (sig_bt[i]) {
case T_BOOLEAN:
case T_CHAR:
case T_BYTE:
case T_SHORT:
case T_INT:
if (int_args < Argument::n_int_register_parameters_c) {
VMReg tmp = INT_ArgReg[int_args++]->as_VMReg();
regs[i].set1(tmp);
} else {
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set1(tmp);
stk_args += 2;
}
break;
case T_LONG:
assert(sig_bt[i + 1] == T_VOID, "expecting half");
// fall through
case T_OBJECT:
case T_ARRAY:
case T_ADDRESS:
case T_METADATA:
// n_int_register_parameters_c的值为6
if (int_args < Argument::n_int_register_parameters_c) {
VMReg tmp = INT_ArgReg[int_args++]->as_VMReg() ;
regs[i].set2( tmp );
} else {
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set2(tmp);
stk_args += 2;
}
break;
case T_FLOAT:
if (fp_args < Argument::n_float_register_parameters_c) {
VMReg tmp = FP_ArgReg[fp_args++]->as_VMReg();
regs[i].set1(tmp);
} else {
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set1(tmp);
stk_args += 2;
}
break;
case T_DOUBLE:
assert(sig_bt[i + 1] == T_VOID, "expecting half");
if (fp_args < Argument::n_float_register_parameters_c) {
VMReg tmp =FP_ArgReg[fp_args++]->as_VMReg();
regs[i].set2(tmp);
} else {
VMReg tmp = VMRegImpl::stack2reg(stk_args);
regs[i].set2(tmp);
stk_args += 2;
}
break;
case T_VOID: // Halves of longs and doubles
assert(i != 0 && (sig_bt[i - 1] == T_LONG || sig_bt[i - 1] == T_DOUBLE),
"expecting half");
regs[i].set_bad();
break;
default:
ShouldNotReachHere();
break;
}
}
return stk_args;
}
其实现非常类似于SharedRuntime::java_calling_convention()函数,这里不再过多介绍。
arraycopy()对应的本地函数的实现如下:
JVM_ENTRY(void, JVM_ArrayCopy(
JNIEnv *env, jclass ignored,
jobject src, jint src_pos,
jobject dst, jint dst_pos,
jint length))
// ...
arrayOop s = arrayOop(JNIHandles::resolve_non_null(src));
arrayOop d = arrayOop(JNIHandles::resolve_non_null(dst));
// 进行数组的拷贝操作
s->klass()->copy_array(s, src_pos, d, dst_pos, length, thread);
JVM_END
共有7个参数,所以在调用本地函数时,需要将1个参数存储在栈上。入参及计算的最终的regs的值如下:
const int total_args_passed=5 BasicType* sig_bbt=[T_OBJECT,T_INT,T_INT,T_OBJECT,T_INT,T_INT] VMRegPair* regs=[ VMRegPair(_first=6*2,_second=13) // 传递的是T_OBJECT VMRegPair(_first=2*2,_second=-1) VMRegPair(_first=1*2,_second=-1) VMRegPair(_first=8*2,_second=17) // 传递的是T_OBJECT VMRegPair(_first=9*2,_second=-1) ]
6个值都可以通过通用寄存器传递,所以_first的值都小于32。另外还有个整数需要传递,所以stk_args的值为2(表示用2个、每个大小为4字节的slot传递整数类型参数)。需要注意的是,对于64位来说,如果要传递long和double类型的值,其实也需要2个4字节大小的slot即可,也就是1个8字节的slot即可,并不是需要2个8字节的slot,这是由调用约定规定的。
公众号 深入剖析Java虚拟机HotSpot 已经更新虚拟机源代码剖析相关文章到60+,欢迎关注,如果有任何问题,可加作者微信mazhimazh,拉你入虚拟机群交流