0 字节的解码完全取决于 CPU 架构。在许多架构上,指令是固定长度的(例如 32 位),因此相关的内容是 00 00 00 00(使用 hexdump 表示法)。
在大多数 Linux 发行版上,clang/llvm 支持内置的多个目标架构(clang -target 和 llvm-objdump),这与 gcc / gas / binutils 不同,因此我能够使用它来检查某些架构我没有安装 cross-gcc / binutils 。使用llvm-objdump --version 查看支持的列表。 (但我不知道如何让它反汇编像 binutils objdump -b binary 这样的原始二进制文件,而且我的 clang 不会自行创建 SPARC 二进制文件。)
在 x86 上,00 00(2 个字节)将 (http://ref.x86asm.net/coder32.html) 解码为 8-bit add with a memory destination。第一个字节是操作码,第二个字节是指定操作数的 ModR/M。
这通常会立即发生段错误(如果eax/rax 不是有效指针),或者一旦执行从零填充部分的末尾落入未映射的页面中,就会发生段错误。 (这种情况在现实生活中会发生,因为 falling off the end of _start 等错误而没有进行退出系统调用),尽管在这些情况下,以下字节并不总是全为零。例如数据或 ELF 元数据。)
x86 64 位模式:ndisasm -b64 /dev/zero | head:
address machine code disassembly
00000000 0000 add [rax],al
x86 32 位模式 (-b32):
00000000 0000 add [eax],al
x86 16 位模式:(-b16):
00000000 0000 add [bx+si],al
AArch32 ARM 模式:cd /tmp && dd if=/dev/zero of=zero bs=16 count=1 && arm-none-eabi-objdump -z -D -b binary -marm zero。 (没有-z,objdump 会跳过大块的全零并显示...)
addr machine code disassembly
0: 00000000 andeq r0, r0, r0
ARM Thumb/Thumb2:arm-none-eabi-objdump -z -D -b binary -marm --disassembler-options=force-thumb zero
0: 0000 movs r0, r0
2: 0000 movs r0, r0
AArch64:aarch64-linux-gnu-objdump -z -D -b binary -maarch64 zero
0: 00000000 .inst 0x00000000 ; undefined
MIPS32:echo .long 0 > zero.S && clang -c -target mips zero.S && llvm-objdump -d zero.o
zero.o: file format ELF32-mips
Disassembly of section .text:
0: 00 00 00 00 nop
PowerPC 32 位和 64 位:-target powerpc 和 -target powerpc64。如果 PowerPC 的任何扩展使用 00 00 00 00 指令编码,或者它仍然是现代 IBM POWER 芯片上的非法指令,则 IDK。
zero.o: file format ELF32-ppc (or ELF64-ppc64)
Disassembly of section .text:
0: 00 00 00 00 <unknown>
IBM S390:clang -c -target systemz zero.S
zero.o: file format ELF64-s390
Disassembly of section .text:
0: 00 00 <unknown>
2: 00 00 <unknown>