【发布时间】:2021-04-12 07:52:28
【问题描述】:
我正在尝试学习 x86-64 汇编,我发现这本书“现代 X86 汇编语言编程:涵盖 x86 64 位、AVX、AVX2 和 AVX-512”,但它使用 MASM 和 Visual C++ 和我使用 Linux。所以我试图将其中的一些程序转换为 NASM 语法,但我遇到了将计算结果存储在传递给函数的指针中的问题。 C++代码是
#include <iostream>
#include <iomanip>
#include <bitset>
using namespace std;
extern "C" int IntegerShift_(unsigned int a, unsigned int count, unsigned int* a_shl, unsigned int* a_shr);
static void PrintResult(const char* s, int rc, unsigned int a, unsigned int count, unsigned int a_shl, unsigned int a_shr)
{
bitset<32> a_bs(a);
bitset<32> a_shr_bs(a_shl);
bitset<32> a_shl_bs(a_shr);
const int w = 10;
const char nl = '\n';
cout << s << nl;
cout << "count = " << setw(w) << count << nl;
cout << "a = " << setw(w) << a << " (0b" << a_bs << ")" << nl;
if (rc == 0)
cout << "Invalid shift count" << nl;
else
{
cout << "shl = " << setw(w) << a_shl << " (0b" << a_shl_bs << ")" << nl;
cout << "shr = " << setw(w) << a_shr << " (0b" << a_shr_bs << ")" << nl;
}
cout << nl;
}
int main()
{
int rc;
unsigned int a, count, a_shl, a_shr;
a = 3119;
count = 6;
rc = IntegerShift_(a, count, &a_shl, &a_shr);
PrintResult("Test 1", rc, a, count, a_shl, a_shr);
return 0;
}
此代码测试用汇编编写的函数 IntegerShift_。 (main 函数中还有一些测试我没有在这里包含,因为它们与我包含的测试基本相同)。 书中原汇编代码为MASM代码:
.code
IntegerShift_ proc
xor eax,eax
cmp edx,31
ja InvalidCount
xchg ecx,edx
mov eax,edx
shl eax,cl
mov [r8],eax
shr edx,cl
mov [r9],edx
mov eax,1
InvalidCount:
ret
IntegerShift_ endp
end
将其转换为 NASM 代码的明显方法(至少据我所知)如下:
section .text
global IntegerShift_
IntegerShift_:
xor eax,eax
cmp esi,31
ja InvalidCount
xchg ecx,esi
mov eax,esi
shl eax,cl
mov [rdx],eax
shr esi,cl
mov [rsi],esi
mov eax,1
InvalidCount:
ret
然而,组装、编译和运行它:
nasm -f elf64 [asm filename]
g++ -Wall -no-pie [object file filename] [cpp filename] -o prog
./prog
导致分段错误。我尝试了所有我能想到的方法来解决这个问题,并为此花费了几个多小时,但我无法让它发挥作用。我几乎可以肯定问题是我尝试将结果存储在 a_shl 和 a_shr 指针的地址中的方式,但我不明白我做错了什么,我真的很感激一些帮助。 提前致谢!
【问题讨论】:
-
请注意,选择参数顺序以匹配调用约定将节省一些指令,例如在 Windows 上首先通过计数,如果您正在针对 x86-64 System V 进行优化,则通过第 4 次,因此它已经在 ECX 中,并且您没有其他需要的参数。使用当前顺序,
mov eax, ecx+xchg ecx, edx是最小的(以字节为单位)方式。首先执行mov更好:它避免了使其依赖于xchg 的输出。但是总共 3 条mov指令可以完成工作(总共 3 条微指令,而不是英特尔的 1 + 3 条指令)。例如对于 Windows,mov eax, ecx/mov ecx, edx/mov edx, eax -
3 movs 是编译器所做的:他们几乎从不使用
xchg r,r:godbolt.org/z/W8Pz6G。当然,如果你有 BMI2,shlx eax, ecx, edx/store eax/shrx eax, ecx, edx/store eax。 felixcloutier.com/x86/sarx:shlx:shrx
标签: c++ assembly x86-64 nasm calling-convention