【问题标题】:copying a value into the address of a pointer in an assembly function called from c++ (nasm)将值复制到从 C++ 调用的汇编函数中的指针地址(nasm)
【发布时间】:2021-04-12 07:52:28
【问题描述】:

我正在尝试学习 x86-64 汇编,我发现这本书“现代 X86 汇编语言编程:涵盖 x86 64 位、AVX、AVX2 和 AVX-512”,但它使用 MASM 和 Visual C++ 和我使用 Linux。所以我试图将其中的一些程序转换为 NASM 语法,但我遇到了将计算结果存储在传递给函数的指针中的问题。 C++代码是

#include <iostream>
#include <iomanip>
#include <bitset>
using namespace std;
extern "C" int IntegerShift_(unsigned int a, unsigned int count, unsigned int* a_shl, unsigned int* a_shr);
static void PrintResult(const char* s, int rc, unsigned int a, unsigned int count, unsigned int a_shl, unsigned int a_shr)
{
        bitset<32> a_bs(a);
        bitset<32> a_shr_bs(a_shl);
        bitset<32> a_shl_bs(a_shr);
        const int w = 10;
        const char nl = '\n';

        cout << s << nl;
        cout << "count = " << setw(w) << count << nl;
        cout << "a = " << setw(w) << a << " (0b" << a_bs << ")" << nl;

        if (rc == 0)
                cout << "Invalid shift count" << nl;
        else
        {
                cout << "shl = " << setw(w) << a_shl << " (0b" << a_shl_bs << ")" << nl;
                cout << "shr = " << setw(w) << a_shr << " (0b" << a_shr_bs << ")" << nl;
        }
        cout << nl;
}

int main()
{
        int rc;
        unsigned int a, count, a_shl, a_shr;
        a = 3119;
        count = 6;
        rc = IntegerShift_(a, count, &a_shl, &a_shr);
        PrintResult("Test 1", rc, a, count, a_shl, a_shr);

    return 0;
}

此代码测试用汇编编写的函数 IntegerShift_。 (main 函数中还有一些测试我没有在这里包含,因为它们与我包含的测试基本相同)。 书中原汇编代码为MASM代码:

    
.code
IntegerShift_ proc
xor eax,eax 
cmp edx,31            
ja InvalidCount            
xchg ecx,edx    
mov eax,edx  
shl eax,cl    
mov [r8],eax  
shr edx,cl   
mov [r9],edx    
mov eax,1
InvalidCount:    
ret    
IntegerShift_ endp
end

将其转换为 NASM 代码的明显方法(至少据我所知)如下:

section .text
global IntegerShift_
IntegerShift_:
xor eax,eax
cmp esi,31           
ja InvalidCount            
xchg ecx,esi    
mov eax,esi  
shl eax,cl    
mov [rdx],eax  
shr esi,cl   
mov [rsi],esi    
mov eax,1
InvalidCount:    
ret 

然而,组装、编译和运行它:

nasm -f elf64 [asm filename]
g++ -Wall -no-pie [object file filename] [cpp filename] -o prog
./prog

导致分段错误。我尝试了所有我能想到的方法来解决这个问题,并为此花费了几个多小时,但我无法让它发挥作用。我几乎可以肯定问题是我尝试将结果存储在 a_shl 和 a_shr 指针的地址中的方式,但我不明白我做错了什么,我真的很感激一些帮助。 提前致谢!

【问题讨论】:

  • 请注意,选择参数顺序以匹配调用约定将节省一些指令,例如在 Windows 上首先通过计数,如果您正在针对 x86-64 System V 进行优化,则通过第 4 次,因此它已经在 ECX 中,并且您没有其他需要的参数。使用当前顺序,mov eax, ecx + xchg ecx, edx 是最小的(以字节为单位)方式。首先执行mov 更好:它避免了使其依赖于xchg 的输出。但是总共 3 条 mov 指令可以完成工作(总共 3 条微指令,而不是英特尔的 1 + 3 条指令)。例如对于 Windows,mov eax, ecx / mov ecx, edx / mov edx, eax
  • 3 movs 是编译器所做的:他们几乎从不使用xchg r,r:godbolt.org/z/W8Pz6G。当然,如果你有 BMI2,shlx eax, ecx, edx/store eax/shrx eax, ecx, edx/store eax。 felixcloutier.com/x86/sarx:shlx:shrx

标签: c++ assembly x86-64 nasm calling-convention


【解决方案1】:

首先,Windows 和 Linux 的调用约定不同。

https://en.wikipedia.org/wiki/X86_calling_conventions

  • 您似乎没有完全更改此设置..

其次,虽然大多数情况下您可以使用 32 位寄存器,但您必须将地址视为完整的 64 位值。

最后,您还要修改 esi 然后使用 rsi - 它们是重叠的寄存器 - 这就是导致您的分段错误的原因。

随着这些变化:

;extern "C" int IntegerShift_(unsigned int a, unsigned int count, unsigned int* a_shl, unsigned int* a_shr);
; RDI, RSI, RDX, RCX,

section .text
global IntegerShift_
IntegerShift_:
xor eax,eax
cmp esi,31
ja InvalidCount
xchg rcx,rsi    ; Need full 64-bit exchange
mov eax,edi     ; (r)di is the 'a' value
shl eax,cl
mov [rdx],eax
shr edi,cl      
mov [rsi],edi
mov eax,1
InvalidCount:
ret

【讨论】:

  • 公平地说,OP 并没有完全忽略调用约定的差异,例如他们正确地更改为使用esi 而不是edx 作为移位计数(第二个参数)。和 R8 的 RDX(第 3 个参数)。但后来他们似乎把其他一切都弄错了,例如。仍然使用 RSI 作为指针(RDI 的可能类型也是错误的?)
  • 另外,您可以通过选择一个未使用的寄存器来替换 xchg(Intel 上为 3 uops),只需 2 个 mov 指令,就像编译器一样。 godbolt.org/z/Yec1TT。这将使移动消除工作。如果您确实想使用xchg,则dst -&gt; src 方向is the faster one on Intel, at least in my testing on Skylake,因此xchg rsi, rcx 将使CL 准备好一个比xchg rcx,rsi 早的循环。但在具有 mov-elimination 的 CPU 上仍然是 1 个周期延迟而不是 0。
  • 虽然这可能更好,但我正在使用一本书,我想先让程序在我的系统上运行,然后再尝试修改代码并尝试改进它。无论如何,我不知道 mov-elimination 存在,所以即使我确实尝试使代码更好,我也可能不会考虑这样做,所以谢谢!
【解决方案2】:

您可以单步执行代码吗?在这种情况下,您应该能够找到它的段错误。

另一种方法是用 C 编写代码并查看反汇编列表。 如果代码在 C 中工作,您可以使用汇编代码并根据自己的喜好对其进行优化。 你试过吗?

另外,你看过这篇文章吗? http://left404.com/2011/01/04/converting-x86-assembly-from-masm-to-nasm-3

【讨论】:

  • 我试图反汇编 C 版本的代码,但由于某种原因,我在汇编代码中找不到该函数(我认为 gcc 在编译期间会更改东西的名称或其他东西)。关于这篇文章,实际上我在尝试将书中的程序转换为 nasm 代码时经常使用它,但显然我的错误是忘记更改某些内容并将寄存器视为 32 位而不是 64 位。无论如何,谢谢!
  • @AmnonTal:如果您使用extern "C",编译器不会更改名称。或者只是将其编译为 C。然后查看 gcc 或 clang asm 输出,而不是反汇编,因此您不必在其他代码中找到它。 How to remove "noise" from GCC/clang assembly output?
猜你喜欢
  • 1970-01-01
  • 2019-07-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-03-30
  • 2013-04-13
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多