【问题标题】:Questions about Hinnant's stack allocator关于 Hinnant 的栈分配器的问题
【发布时间】:2012-07-23 19:03:58
【问题描述】:

我一直在使用 Howard Hinnant 的 stack allocator,它的作用就像一个魅力,但我对实现的一些细节有点不清楚。

  1. 为什么要使用全局运算符newdeleteallocate()deallocate() 成员函数分别使用 ::operator new::operator delete。同样,成员函数construct() 使用全局放置new。为什么不允许任何用户定义的全局或特定类重载?
  2. 为什么对齐设置为硬编码的 16 字节而不是 std::alignment_of<T>
  3. 为什么构造函数和max_sizethrow() 异常规范?这不气馁吗(例如,参见更有效的 C++ 第 14 条)?当分配器发生异常时,是否真的需要终止和中止?这会随着新的 C++11 noexcept 关键字而改变吗?
  4. construct() 成员函数将是完美转发(到被调用的构造函数)的理想候选者。这是编写符合 C++11 的分配器的方法吗?
  5. 为了使当前代码符合 C++11,还需要进行哪些其他更改?

【问题讨论】:

  • ::new (p) T 保证您将构造一个 T 并且不会发生其他任何事情。如果一个类想要提供一个与通常的全局放置 new 具有相同签名的分配函数,那么它可能会做更多的事情。将::new (p) T 视为显式构造函数调用,而不是内存分配(后者可以覆盖。(请注意,无法覆盖通常的全局放置 new。)
  • @LucDanton 好的,所以如果一个类已经定义了它自己的新位置(例如用于记录目的),它仍然会被::new(p) T调用?
  • @rhalbersma 如果您想记录这种事情,请登录构造函数。 new 的位置(与 new 的其他形式不同)是该语言的一个原语,这就是为什么覆盖它非常粗略。
  • 至少对于对齐方式,Effective C++(第 3 版)说(第 50 项,第 249 页):“C++ 要求所有 operator news 返回适合 对齐的指针任何 数据类型。malloc 在相同的要求下工作。”这通常意味着 16 字节对齐,所以他是一致的。不知道c11和c++11是不是一样,但很有可能。
  • 为了补充 BoBTFish 的评论,alignas 用于声明对齐的成员,std::aligned_storage 用于对齐的自动原始存储,std::align 用于对齐的动态分配的原始存储。

标签: c++ c++11 memory-alignment allocator exception-specification


【解决方案1】:

我一直在使用 Howard Hinnant 的 stack allocator,它确实有效 像一个魅力,但实施的一些细节有点 我不清楚。

很高兴它一直在为你工作。

1。为什么使用全局运算符newdeleteallocate()deallocate() 成员函数使用 ::operator new::operator delete 分别。同样,成员函数 construct() 使用全局布局 new。为什么不允许任何 用户定义的全局或特定类的重载?

没有什么特别的原因。随意以最适合您的方式修改此代码。这只是一个例子,它绝不是完美的。唯一的要求是分配器和释放器提供正确对齐的内存,并且构造成员构造一个参数。

在 C++11 中,构造(和销毁)成员是可选的。如果您在提供allocator_traits 的环境中运行,我鼓励您将它们从分配器中删除。要找出答案,只需删除它们,看看是否还能编译。

2。为什么对齐设置为硬编码的 16 字节而不是 std::alignment_of<T>

std::alignment_of<T> 可能会正常工作。那天我可能是偏执狂。

3。为什么构造函数和max_sizethrow() 异常规范?这不是气馁吗(例如,参见更有效的 C++ 第 14 项)?是否真的有必要终止和中止时 分配器中发生异常?这是否会随着新的 C++11 而改变 noexcept关键字?

这些成员永远不会扔。对于 C++11,我应该将它们更新为 noexcept。在 C++11 中,用noexcept 装饰事物变得更加重要,尤其是特殊成员。在 C++11 中,可以检测表达式是否为 nothrow。代码可以根据该答案进行分支。已知为 nothrow 的代码更有可能导致通用代码分支到更有效的路径。 std::move_if_noexcept 是 C++11 中的典型示例。

永远不要使用throw(type1, type2)。它已在 C++11 中被弃用。

当你真的想说:这永远不会抛出时,请使用throw(),如果我错了,请终止程序以便我可以调试它。 throw() 在 C++11 中也已弃用,但有一个替代品:noexcept

4。 construct() 成员函数将是完美转发(到被调用的构造函数)的理想候选者。这是 编写符合 C++11 的分配器的方法?

是的。然而allocator_traits 会为你做这件事。让它。 std::lib 已经为您调试了该代码。 C++11 容器将调用allocator_traits<YourAllocator>::construct(your_allocator, pointer, args...)。如果你的分配器实现了这些函数,allocator_traits 将调用你的实现,否则它会调用经过调试的、高效的默认实现。

5。为了使当前代码符合 C++11,还需要进行哪些其他更改?

说实话,这个分配器并不真正符合 C++03 或 C++11。当您复制分配器时,原件和副本应该彼此相等。在这个设计中,这绝不是真的。然而,这件事在许多情况下仍然只是碰巧起作用。

如果你想让它严格符合,你需要另一个间接级别,这样副本将指向同一个缓冲区。

除此之外,C++11 分配器所以比 C++98/03 分配器更容易构建。这是您必须做的最低要求:

template <class T>
class MyAllocator
{
public:
    typedef T value_type;

    MyAllocator() noexcept;  // only required if used
    MyAllocator(const MyAllocator&) noexcept;  // copies must be equal
    MyAllocator(MyAllocator&&) noexcept;  // not needed if copy ctor is good enough
    template <class U>
        MyAllocator(const MyAllocator<U>& u) noexcept;  // requires: *this == MyAllocator(u)

    value_type* allocate(std::size_t);
    void deallocate(value_type*, std::size_t) noexcept;
};

template <class T, class U>
bool operator==(const MyAllocator<T>&, const MyAllocator<U>&) noexcept;

template <class T, class U>
bool operator!=(const MyAllocator<T>&, const MyAllocator<U>&) noexcept;

您可以选择考虑使MyAllocator 可交换并将以下嵌套类型放入分配器中:

typedef std::true_type propagate_on_container_swap;

还有一些其他类似的旋钮可以在 C++11 分配器上进行调整。但是所有的旋钮都有合理的默认值。

更新

在上面我注意到我的stack allocator 不符合,因为副本不相等。我决定将此分配器更新为符合 C++11 的分配器。新的分配器称为short_allocator,并记录在here

short_allocatorstack allocator 的不同之处在于“内部”缓冲区不再位于分配器内部,而是现在可以位于本地堆栈上、给定线程或静态存储时间。 arena 不是线程安全的,但请注意这一点。如果你愿意,你可以让它成为线程安全的,但这会带来收益递减(最终你会重新发明 malloc)。

这是符合要求的,因为分配器的副本都指向同一个外部arena。注意N 的单位现在是字节,而不是T 的数量。

可以通过添加 C++98/03 样板(类型定义、构造成员、销毁成员等)将此 C++11 分配器转换为 C++98/03 分配器。一项乏味但简单的任务。

对于新的short_allocator,这个问题的答案保持不变。

【讨论】:

  • 您的原始代码在 VC++ 上工作,并进行了以下修改:禁用警告 4100(它认为 pp-&gt;~T() 中未引​​用),以及指针算法的一些改组:而不是 (pointer)&amp;buf_ + N - ptr_ &gt;= n,我必须写 ptr_ + n &lt;= (pointer)&amp;buf_ + N 以避免虚假的签名/未签名错误。
  • VC++ 没有&lt;allocator_traits&gt;,我手动编写了一些构造重载。我还写了pointer begin() { return reinterpret_cast&lt;pointer&gt; &amp;buf_; }强调指针转换,写pointer end() { return begin() + N; }方便。
  • 也许是一个有趣的性能统计:我在跳棋/跳棋游戏引擎中使用stack_alloc,该引擎每秒生成大约 100 万个移动列表,其中移动是一个 24 字节的结构,我使用 @ 987654367@ 分配器。速度或多或少与组合 std::allocatorvector.reserve(32) 相同,但无需在任何地方编写此代码(或编写执行此操作的容器包装器)。性能在std::array 的 12% 以内,但没有安全问题。在计算机国际象棋论坛上查看此主题:talkchess.com/forum/viewtopic.php?t=39934
  • @MikeMB:是的。这就是 UB 的那种东西,因为几十年前在一个黑暗的房间里有 6 个家伙这么说。如果他们说的是别的东西,那就是别的东西了。他们之所以这么说,是因为当时分段架构是一种明显而现实的危险。我上面的代码假设了一个平坦的地址空间,并且一个编译器不会根据几十年前的过时决定任意更改您的代码(这是一个越来越危险的假设,因为编译器优化器进一步进入了太聪明的一半竞技场)。
  • @TemplateRex:非常感谢,我已经多次阅读 [expr.rel] 并且总是阅读那篇文章。
猜你喜欢
  • 2019-12-13
  • 2013-02-15
  • 1970-01-01
  • 1970-01-01
  • 2011-08-04
  • 2019-06-02
  • 2015-11-08
  • 2021-10-30
  • 2011-01-09
相关资源
最近更新 更多