【问题标题】:Dual emission of constructor symbols构造函数符号的双重发射
【发布时间】:2011-10-18 18:36:52
【问题描述】:

今天,我发现了一个关于g++nm 的相当有趣的事情……构造函数定义似乎在库中有两个条目。

我有一个标题thing.hpp:

class Thing
{
    Thing();

    Thing(int x);

    void foo();
};

还有thing.cpp:

#include "thing.hpp"

Thing::Thing()
{ }

Thing::Thing(int x)
{ }

void Thing::foo()
{ }

我编译这个:

g++ thing.cpp -c -o libthing.a

然后,我在上面运行nm

%> nm -gC libthing.a
0000000000000030 T Thing::foo()
0000000000000022 T Thing::Thing(int)
000000000000000a T Thing::Thing()
0000000000000014 T Thing::Thing(int)
0000000000000000 T Thing::Thing()
                 U __gxx_personality_v0

如您所见,Thing 的两个构造函数都在生成的静态库中列出了两个条目。我的 g++ 是 4.4.3,但同样的行为也发生在 clang,所以这不仅仅是 gcc 的问题。

这不会导致任何明显的问题,但我想知道:

  • 为什么定义的构造函数会列出两次?
  • 为什么这不会导致“符号 __ 的多重定义”问题?

编辑:对于 Carl,不带 C 参数的输出:

%> nm -g libthing.a
0000000000000030 T _ZN5Thing3fooEv
0000000000000022 T _ZN5ThingC1Ei
000000000000000a T _ZN5ThingC1Ev
0000000000000014 T _ZN5ThingC2Ei
0000000000000000 T _ZN5ThingC2Ev
                 U __gxx_personality_v0

如你所见...同一个函数生成多个符号,这还是蛮好奇的。

当我们在这里的时候,这里是生成的程序集的一部分:

.globl _ZN5ThingC2Ev
        .type   _ZN5ThingC2Ev, @function
_ZN5ThingC2Ev:
.LFB1:
        .cfi_startproc
        .cfi_personality 0x3,__gxx_personality_v0
        pushq   %rbp
        .cfi_def_cfa_offset 16
        movq    %rsp, %rbp
        .cfi_offset 6, -16
        .cfi_def_cfa_register 6
        movq    %rdi, -8(%rbp)
        leave
        ret
        .cfi_endproc
.LFE1:
        .size   _ZN5ThingC2Ev, .-_ZN5ThingC2Ev
        .align 2
.globl _ZN5ThingC1Ev
        .type   _ZN5ThingC1Ev, @function
_ZN5ThingC1Ev:
.LFB2:
        .cfi_startproc
        .cfi_personality 0x3,__gxx_personality_v0
        pushq   %rbp
        .cfi_def_cfa_offset 16
        movq    %rsp, %rbp
        .cfi_offset 6, -16
        .cfi_def_cfa_register 6
        movq    %rdi, -8(%rbp)
        leave
        ret
        .cfi_endproc

所以生成的代码是……嗯……一样的。


编辑:为了查看实际调用了什么构造函数,我将Thing::foo() 更改为:

void Thing::foo()
{
    Thing t;
}

生成的程序集是:

.globl _ZN5Thing3fooEv
        .type   _ZN5Thing3fooEv, @function
_ZN5Thing3fooEv:
.LFB550:
        .cfi_startproc
        .cfi_personality 0x3,__gxx_personality_v0
        pushq   %rbp
        .cfi_def_cfa_offset 16
        movq    %rsp, %rbp
        .cfi_offset 6, -16
        .cfi_def_cfa_register 6
        subq    $48, %rsp
        movq    %rdi, -40(%rbp)
        leaq    -32(%rbp), %rax
        movq    %rax, %rdi
        call    _ZN5ThingC1Ev
        leaq    -32(%rbp), %rax
        movq    %rax, %rdi
        call    _ZN5ThingD1Ev
        leave
        ret
        .cfi_endproc

所以它正在调用完整的对象构造函数。

【问题讨论】:

  • 您将-C 标志的问题混淆为nm。如果您不使用它,您会看到发出的构造函数实际上具有不同的符号(这是您第二个问题的答案)。我不知道为什么会使用不同的符号名称发出两个相同的构造函数,但我现在正在尝试阅读……如果我弄明白了。
  • 您的输出看起来与我在这里得到的大致相同 - 所以问题实际上是“带有C1 的名称与带有C2 的名称之间有什么区别是吗?”,而我对这个问题没有答案。我很惊讶文档没有更多关于它的信息.... hrm.
  • 有趣的是,完全相同的行为发生在两个不同的编译器中。
  • 我很想看看子类调用哪一个,new 调用哪一个...

标签: c++ gcc constructor


【解决方案1】:

我们首先声明GCC followsthe Itanium C++ ABI


根据 ABI,Thing::foo() 的错误名称很容易解析:

_Z     | N      | 5Thing  | 3foo | E          | v
prefix | nested | `Thing` | `foo`| end nested | parameters: `void`

您可以类似地读取构造函数名称,如下所示。注意没有给出构造函数“name”,而是一个C 子句:

_Z     | N      | 5Thing  | C1          | E          | i
prefix | nested | `Thing` | Constructor | end nested | parameters: `int`

但是C1 是什么?您的副本有C2。这是什么意思

嗯,this is quite simple too

  <ctor-dtor-name> ::= C1   # complete object constructor
                   ::= C2   # base object constructor
                   ::= C3   # complete object allocating constructor
                   ::= D0   # deleting destructor
                   ::= D1   # complete object destructor
                   ::= D2   # base object destructor

等等,为什么这简单?这个类没有基础。为什么它有一个“完整的对象构造函数”每个都有一个“基础对象构造函数”?

  • This Q&A 向我暗示这只是多态性支持的副产品,尽管在这种情况下实际上并不需要它。

  • 请注意,c++filt 曾经将此信息包含在其解组后的输出中,but doesn't any more

  • This forum post 提出了同样的问题,唯一的回答并没有更好地回答它,除了暗示 GCC 可以 在不涉及多态性时避免发出两个构造函数,并且这种行为应该在未来得到改善。

  • This newsgroup posting 描述了由于这种双重发射而在构造函数中设置断点的问题。再次声明,问题的根源在于对多态性的支持。

其实this is listed as a GCC "known issue":

G++ 发出构造函数和析构函数的两个副本。

通常有三种类型的构造函数(和 析构函数)。

  • 完整的对象构造函数/析构函数。
  • 基础对象构造函数/析构函数。
  • 分配构造函数/释放析构函数。

前两个是不同的,当虚拟基类是 参与。


这些不同构造函数的含义seems to be as follows

  • “完整的对象构造函数”。它还构造了虚拟基类。

  • “基础对象构造函数”。它创建对象本身,以及数据成员和非虚拟基类。

  • “分配对象构造函数”。它完成了完整的对象构造函数所做的所有事情,而且它调用 operator new 来实际分配内存...但显然这通常不常见。

如果你没有虚拟基类,[前两个]是 完全相同的; GCC 将在足够的优化级别上,实际上是别名 两者的符号相同。

【讨论】:

  • 万岁的答案 - 我想我正在接近这个,但很高兴看到正确的信息。
  • @Tomalak Geret'kal:+1,用于回答问题的非常详细的研究。
  • 这是一个很棒的答案,但是有文档说明这些构造函数类型之间的区别吗?大多数情况下:什么是“分配构造函数”和“删除析构函数”?它们是否用于重载operator newoperator delete
  • @Travis:我还不完全确定。 bdonlan [啊,所以,不要在 cmets FFS 中限制我的通知] 指出 this highly-related question,那里似乎有很多相关信息。
  • @Travis:是的,我认为他们是。我不希望这个答案变成整个构建/销毁过程的通用文档,但我在最新的编辑中简要介绍了这一点。
猜你喜欢
  • 1970-01-01
  • 2018-04-13
  • 2022-01-26
  • 2015-12-13
  • 1970-01-01
  • 2016-05-08
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多