【问题标题】:gdb error: Backtrace stopped: previous frame identical to this frame (corrupt stack?)gdb 错误:回溯停止:前一帧与此帧相同(损坏的堆栈?)
【发布时间】:2019-03-30 01:48:26
【问题描述】:

我在调试 ARMv7 目标上的多线程 C++ 应用程序时遇到问题。该问题出现在两个不同的 ARM 目标上,我为它们使用了不同的工具链:

Backtrace stopped: previous frame identical to this frame (corrupt stack?)

我检查了一些线程,但是(由于与简约的多线程程序有同样的问题)似乎我 * 没有损坏的堆栈 * 虚函数或函数指针的任何问题

我主要使用目标 Toradex Colibri iMX6,它上面运行着 Angstrom Linux 2016.12

问题

  • 我构建程序的方式有问题吗?
  • 有没有。我使用 gdbserver / gdb 的方式有问题吗?
  • 我必须使用哪些选项来修复调试器输出?

我在目标上通过gdbserver 进行调试,在我的主机上通过工具链的arm-linux-gnueabihf-gdb 进行调试。 任何目标都没有本机 gdb。 我可以为 Linux x86 构建应用程序,但目前无法在 PC 上重现该错误。

软件问题

似乎有两个线程卡住了,可能是由于两个互斥锁死锁,或者一个线程试图第二次获取一个互斥锁 (虽然这似乎不太可能,但在我将互斥锁配置为 recursive 后出现了该错误;我必须检查该线程中使用的第二个互斥锁)。

所有其他线程似乎都运行良好。

软件构建和调试配置

构建设置:

我正在使用 Toradex 提供的工具链和 arm-linux-gnueabihf-g++

-std=c++11 -Wall -Werror -Wextra -Wno-unused-result -Winit-self -Wmissing-include-dirs -Wpointer-arith -Wno-format-security -Wno-implicit-fallthrough -Wl,-Map=output.map -ggdb -g3 -fno-inline -O0

我将相同的程序传递给调试器(即目标上的gdbserver 和主机上的arm-linux-gnueabihf-gdb

$ (gdb) set sysroot </path/to/libs>
$ (gdb) file <binary>
$ (gdb) target remote IP:port

共享库:

对于共享库,我已将 /usr/lib/lib 从目标复制到主机。然后,我下载了可用于目标/分发的调试库,并用这些库替换了原始共享库。

(gdb) info sharedlibrary
From        To          Syms Read   Shared Object Library
0x76fcf800  0x76feaa70  Yes         /path/to/libs/lib/ld-linux-armhf.so.3
0x76fb9700  0x76fbcd2c  Yes         /path/to/libs/lib/librt.so.1
0x76f940c0  0x76fa2e0c  Yes         /path/to/libs/lib/libpthread.so.0
0x76f01630  0x76f72a10  Yes (*)     /path/to/libs/usr/lib/libstdc++.so.6
0x76e14d38  0x76e48028  Yes         /path/to/libs/lib/libm.so.6
0x76e041b0  0x76e0e7ec  Yes         /path/to/libs/lib/libgcc_s.so.1
0x76cd1000  0x76dc2b10  Yes         /path/to/libs/lib/libc.so.6
0x7449c96c  0x744a29e4  Yes         /path/to/libs/lib/libnss_files.so.2
(*): Shared library is missing debugging information.

我找不到libstdc++.so.6 的调试库。

调试结果

调试简单的单线程应用程序并在目标上崩溃:

  • 有效,即不报告上面的错误消息

在目标上调试简单的多线程应用程序,无论有无死锁:

(gdb) bt
#0  0x76d6cd44 in uname () at ../sysdeps/unix/syscall-template.S:84
#1  0x00000000 in ?? ()
Backtrace stopped: previous frame identical to this frame (corrupt stack?)

在 Linux-x86 上调试相同的简单多线程应用程序,无论是否存在死锁:

  • 作品

在 PC 上调试有缺陷的应用程序:

  • 似乎有效,但目前我们无法重现该错误

在目标上调试受影响的应用程序:

Thread 1 received signal SIGINT, Interrupt.
0x76f9facc in __lll_robust_lock_wait (futex=0x257b94 <namespace1::function()::su_place+20>, private=0)
at /usr/src/debug/glibc/2.24-r0/git/nptl/lowlevelrobustlock.c:46
46    /usr/src/debug/glibc/2.24-r0/git/nptl/lowlevelrobustlock.c: No such file or directory.
(gdb) thread apply all bt

Thread 6 (Thread 6606.6630):
#0  0x76d832c8 in __setreuid (ruid=8, euid=0)
at /usr/src/debug/glibc/2.24-r0/git/sysdeps/unix/sysv/linux/i386/setreuid.c:29
#1  0x7efff06c in ?? ()
Backtrace stopped: previous frame identical to this frame (corrupt stack?)

Thread 5 (Thread 6606.6629):
#0  0x76d55d44 in uname () at ../sysdeps/unix/syscall-template.S:84
#1  0x00000000 in ?? ()
Backtrace stopped: previous frame identical to this frame (corrupt stack?)

Thread 4 (Thread 6606.6628):
#0  0x76d55d44 in uname () at ../sysdeps/unix/syscall-template.S:84
#1  0x00000000 in ?? ()
Backtrace stopped: previous frame identical to this frame (corrupt stack?)

Thread 3 (Thread 6606.6627):
#0  0x76d55d44 in uname () at ../sysdeps/unix/syscall-template.S:84
#1  0x00000000 in ?? ()
Backtrace stopped: previous frame identical to this frame (corrupt stack?)

Thread 2 (Thread 6606.6626):
#0  __lll_robust_lock_wait (
futex=0x25b950 <namespace_2::a_function()::a_static_member+152>, private=128)
at /usr/src/debug/glibc/2.24-r0/git/nptl/lowlevelrobustlock.c:31
#1  0x00000080 in ?? ()
Backtrace stopped: previous frame identical to this frame (corrupt stack?)

Thread 1 (Thread 6606.6606):
#0  0x76f9facc in __lll_robust_lock_wait (futex=0x257b94 <namespace1::function()::su_place+20>, 
private=0) at /usr/src/debug/glibc/2.24-r0/git/nptl/lowlevelrobustlock.c:46
#1  0x00000002 in ?? ()
Backtrace stopped: previous frame identical to this frame (corrupt stack?)

更新

我可以使用valgrind 和 SW 的 PC 版本找到错误(互斥死锁)。

但是,这里的问题是关于 gdb 的问题,我还无法理解或解决。

【问题讨论】:

  • 您是否尝试过使用内存调试工具,例如Valgrind 或类似工具?
  • 否 - valgrind 不适用于目标平台。
  • 您的 x86 构建平台上是否有可以运行 Valgrind 的测试套件?
  • 如果您可以在主机平台上测试您的程序(如您的问题所示),然后从那里开始。即使它看起来有效,Valgrind 也可以指出一些只发生在目标系统上的问题。并且不要忘记 Valgrind 是开源,并且可以针对尚未构建的目标进行重建(并且已经有很多目标)。
  • 你见过并尝试过this吗?

标签: c++ linux multithreading gdb


【解决方案1】:

然后,我下载了可用于目标/分发的调试库,并用这些库替换了原来的共享库。

这可能是错误的做法(取决于您所说的“调试库”的确切含义),并且可能会导致您的问题。见this answer

作为第一步,我将使用您在目标上使用的完全相同相同的库,并检查这是否会改变 GDB 的行为。

【讨论】:

  • 我最初使用的库与目标上的库完全相同 - 结果更糟。来自gdb 的相同错误消息,以及来自库的不太详细的输出。 gdbserver 的文档说您可以在目标上使用剥离的二进制文件,只有在您需要带有调试信息的二进制文件的主机上。我认为这同样适用于图书馆。
猜你喜欢
  • 2015-11-08
  • 1970-01-01
  • 2019-03-02
  • 2012-04-06
  • 2015-11-07
  • 2014-11-30
  • 2019-07-28
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多