【发布时间】:2017-07-14 09:09:09
【问题描述】:
这个问题与我的另一个帖子有关:why allocate_shared and make_shared so slow
在这里我可以更清楚地描述问题。
想想下面的代码:
struct A {
char data_[0x10000];
};
class C {
public:
C() : a_() { }
A a_;
};
int main() {
C c;
return 0;
}
我发现对于代码C() : a_(),编译器使用memset(addr,0,0x10000)作为A的构造函数。如果类型A有一个空的构造函数,那么asm代码是对的。
为了更清楚地描述问题,我写了一些测试代码:
#include <stdlib.h>
struct A {
//A() {}
char data_[0x10000];
void dummy() { // avoid optimize erase by compiler
data_[rand() % sizeof(data_)] = 1;
}
int dummy2() { // avoid optimize erase by compiler
return data_[0];
}
};
class B {
public:
template<class ... T> B(T&...t)
: a_(std::forward<T>(t)...) {
}
A a_;
};
class C {
public:
C() : a_() {
}
A a_;
};
template<class ... T>
int test(T&...t) {
A a(t...);
a.dummy();
return a.dummy2();
}
int main() {
A a;
a.dummy();
auto r1 = a.dummy2();
auto r2 = test();
B b;
b.a_.dummy();
auto r3 = b.a_.dummy2();
C c;
c.a_.dummy();
auto r4 = c.a_.dummy2();
return r1 + r2 + r3 + r4;
}
我用 vs2017 编译了代码,在 windows 10 中,x86 发布版本。 然后我检查了asm代码:
template<class ... T>
int test(T&...t) {
00E510B8 call _chkstk (0E51CE0h)
00E510BD mov eax,dword ptr [__security_cookie (0E53004h)]
00E510C2 xor eax,ebp
00E510C4 mov dword ptr [ebp-4],eax
A a(t...);
00E510C7 push 10000h
00E510CC lea eax,[a]
00E510D2 push 0
00E510D4 push eax
00E510D5 call _memset (0E51C3Ah)
00E510DA add esp,0Ch
a.dummy();
00E510DD call dword ptr [__imp__rand (0E520B4h)]
}
00E510E3 mov ecx,dword ptr [ebp-4]
很明显,函数test()调用memset(p, 0, 0x10000)。
如果我在 A 中添加一个空的构造函数(A(){} 行),编译器会删除 memset。
那为什么A类型没有构造函数时代码调用memset,而A有构造函数时不调用memset?
它是 c++ 标准的一部分,还是只是编译器错误?
显然 memset(p, 0, sizeof(T)) 是无用且有害的,它会减慢程序的速度。我该如何解决?
【问题讨论】:
-
这看起来像是默认初始化和零初始化之间的区别。不过,我对细节很模糊,所以请参阅例如stackoverflow.com/questions/27484483/…
-
没有
test2()函数... -
@K.Kirsz 测试,抱歉
标签: c++ c++11 constructor perfect-forwarding