在尝试了一些事情之后,我终于设法弄清楚了如何做到这一点。
首先,在glibc中,malloc被定义为弱符号,表示它可以被应用程序或者共享库覆盖。因此,不一定需要LD_PRELOAD。相反,我在共享库中实现了以下功能:
void*
malloc (size_t size)
{
[ ... ]
}
由应用程序调用而不是 glibcs malloc。
现在,为了等同于 __malloc_hooks 功能,仍然缺少一些东西。
1.) 来电者地址
除了malloc的原始参数,glibcs__malloc_hooks还提供了调用函数的地址,这实际上是malloc将返回的返回地址。为了达到同样的目的,我们可以使用 gcc 中的__builtin_return_address 函数。我没有研究过其他编译器,因为无论如何我都仅限于 gcc,但如果你碰巧知道如何便携地做这样的事情,请给我留言:)
我们的malloc 函数现在看起来像这样:
void*
malloc (size_t size)
{
void *caller = __builtin_return_address(0);
[ ... ]
}
2.) 从你的钩子中访问glibcs malloc
由于我的应用程序仅限于 glibc,因此我选择使用 __libc_malloc 来访问原始 malloc 实现。或者,也可以使用dlsym(RTLD_NEXT, "malloc"),但可能会导致此函数在第一次调用时使用calloc,这可能会导致无限循环导致段错误。
完整的 malloc 钩子
我的完整钩子函数现在看起来像这样:
extern void *__libc_malloc(size_t size);
int malloc_hook_active = 0;
void*
malloc (size_t size)
{
void *caller = __builtin_return_address(0);
if (malloc_hook_active)
return my_malloc_hook(size, caller);
return __libc_malloc(size);
}
my_malloc_hook 看起来像这样:
void*
my_malloc_hook (size_t size, void *caller)
{
void *result;
// deactivate hooks for logging
malloc_hook_active = 0;
result = malloc(size);
// do logging
[ ... ]
// reactivate hooks
malloc_hook_active = 1;
return result;
}
当然,calloc、realloc 和 free 的钩子的工作方式类似。
动态和静态链接
使用这些功能,动态链接可以开箱即用。链接包含 malloc 钩子实现的 .so 文件将导致应用程序对 malloc 的所有调用以及所有通过我的钩子路由的库调用。静态链接虽然是有问题的。我还没有完全理解它,但是在静态链接中 malloc 不是一个弱符号,导致链接时出现多重定义错误。
如果您出于某种原因需要静态链接,例如通过调试符号将第 3 方库中的函数地址转换为代码行,那么您可以静态链接这些第 3 方库,同时仍然动态链接 malloc 挂钩,避免多重定义问题.我还没有找到更好的解决方法,如果你知道,请随时给我留言。
这是一个简短的例子:
gcc -o test test.c -lmalloc_hook_library -Wl,-Bstatic -l3rdparty -Wl,-Bdynamic
3rdparty 将静态链接,而malloc_hook_library 将动态链接,从而产生预期的行为,并且3rdparty 中的函数地址可通过test 中的调试符号进行转换。很整洁吧?
结论
上述技术描述了一种不被弃用的、与__malloc_hooks 几乎等效的方法,但有一些限制:
__builtin_caller_address 仅适用于gcc
__libc_malloc 仅适用于glibc
dlsym(RTLD_NEXT, [...]) 是glibc 中的 GNU 扩展
链接器标志 -Wl,-Bstatic 和 -Wl,-Bdynamic 特定于 GNU binutils。
换句话说,这个解决方案是完全不可移植的,如果要将 hooks 库移植到非 GNU 操作系统,则必须添加替代解决方案。