【发布时间】:2021-02-10 08:53:52
【问题描述】:
我想详细了解 AFL 的代码检测。
编译示例程序sample.c
int main(int argc, char **argv) {
int ret = 0;
if(argc > 1) {
ret = 7;
} else {
ret = 12;
}
return ret;
}
使用gcc -c -o obj/sample-gcc.o src/sample.c 和afl-gcc -c -o obj/sample-afl-gcc.o src/sample.c 并使用objdump -d 反汇编会导致不同的汇编代码:
[海合会]
0000000000000000 <main>:
0: f3 0f 1e fa endbr64
4: 55 push %rbp
5: 48 89 e5 mov %rsp,%rbp
8: 89 7d ec mov %edi,-0x14(%rbp)
b: 48 89 75 e0 mov %rsi,-0x20(%rbp)
f: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp)
16: 83 7d ec 01 cmpl $0x1,-0x14(%rbp)
1a: 7e 09 jle 25 <main+0x25>
1c: c7 45 fc 07 00 00 00 movl $0x7,-0x4(%rbp)
23: eb 07 jmp 2c <main+0x2c>
25: c7 45 fc 0c 00 00 00 movl $0xc,-0x4(%rbp)
2c: 8b 45 fc mov -0x4(%rbp),%eax
2f: 5d pop %rbp
30: c3 retq
[AFL-GCC]
0000000000000000 <main>:
0: 48 8d a4 24 68 ff ff lea -0x98(%rsp),%rsp
7: ff
8: 48 89 14 24 mov %rdx,(%rsp)
c: 48 89 4c 24 08 mov %rcx,0x8(%rsp)
11: 48 89 44 24 10 mov %rax,0x10(%rsp)
16: 48 c7 c1 0e ff 00 00 mov $0xff0e,%rcx
1d: e8 00 00 00 00 callq 22 <main+0x22>
22: 48 8b 44 24 10 mov 0x10(%rsp),%rax
27: 48 8b 4c 24 08 mov 0x8(%rsp),%rcx
2c: 48 8b 14 24 mov (%rsp),%rdx
30: 48 8d a4 24 98 00 00 lea 0x98(%rsp),%rsp
37: 00
38: f3 0f 1e fa endbr64
3c: 31 c0 xor %eax,%eax
3e: 83 ff 01 cmp $0x1,%edi
41: 0f 9e c0 setle %al
44: 8d 44 80 07 lea 0x7(%rax,%rax,4),%eax
48: c3 retq
- AFL(通常)在每个基本块前添加一个蹦床来跟踪执行的路径 [https://github.com/mirrorer/afl/blob/master/afl-as.h#L130]
-> 指令 0x00
lea直到 0x30lea - AFL(通常)向程序添加一个主要有效负载(由于简单性我将其排除在外)[https://github.com/mirrorer/afl/blob/master/afl-as.h#L381]
- AFL 声称使用 GCC 的包装器,所以我希望其他一切都相同。为什么 if-else-condition 的编译方式仍然不同?
- 额外问题:如果没有可用源代码的二进制文件应该在不使用 AFL 的 QEMU 模式或 Unicorn 模式的情况下手动检测,这可以通过(天真地)将主要有效负载和每个蹦床手动添加到二进制文件中来实现,或者是有更好的方法吗?
【问题讨论】:
-
最好使用
-S选项输出汇编代码而不是反汇编生成的代码。 -
关于你的奖金问题:理论上,是的。但二进制重写并不总能保证有效。这或多或少是 WinAFL 所做的:github.com/googleprojectzero/winafl#the-winafl-approach
-
@Jabberwocky 使用
-S帮助我发现了afl-gcc使用的默认标志。感谢那。不过,您能否解释一下为什么除了使用一个命令之外,输出汇编代码比反汇编生成的代码更好?
标签: c assembly gcc instrumentation american-fuzzy-lop