【发布时间】:2012-12-30 08:31:43
【问题描述】:
它与这个问题松散相关:Are std::thread pooled in C++11?。虽然问题不同,但意图是一样的:
问题 1:使用您自己的(或第三方库)线程池来避免昂贵的线程创建是否仍然有意义?
另一个问题的结论是,您不能依赖 std::thread 进行池化(它可能会或可能不会)。但是,std::async(launch::async) 似乎有更高的机会被合并。
它不认为它是由标准强制的,但恕我直言,如果线程创建速度很慢,我希望所有好的 C++11 实现都会使用线程池。只有在创建新线程成本低廉的平台上,我希望它们总是产生一个新线程。
问题2:这只是我的想法,但我没有事实可以证明。我很可能弄错了。这是有根据的猜测吗?
最后,我在这里提供了一些示例代码,首先说明我认为线程创建可以如何用async(launch::async) 来表达:
示例 1:
thread t([]{ f(); });
// ...
t.join();
变成
auto future = async(launch::async, []{ f(); });
// ...
future.wait();
示例 2:触发后忘记线程
thread([]{ f(); }).detach();
变成
// a bit clumsy...
auto dummy = async(launch::async, []{ f(); });
// ... but I hope soon it can be simplified to
async(launch::async, []{ f(); });
问题 3:您更喜欢async 版本还是thread 版本?
剩下的不再是问题的一部分,只是为了澄清:
为什么必须将返回值分配给虚拟变量?
不幸的是,当前的 C++11 标准强制您捕获 std::async 的返回值,否则会执行析构函数,该析构函数会一直阻塞直到操作终止。一些人认为这是标准中的错误(例如,Herb Sutter)。
cppreference.com 的这个例子很好地说明了这一点:
{
std::async(std::launch::async, []{ f(); });
std::async(std::launch::async, []{ g(); }); // does not run until f() completes
}
另一个澄清:
我知道线程池可能还有其他合法用途,但在这个问题上,我只对避免昂贵的线程创建成本方面感兴趣。
我认为仍然存在线程池非常有用的情况,尤其是当您需要对资源进行更多控制时。 例如,服务器可能决定同时处理固定数量的请求,以保证快速响应时间并增加内存使用的可预测性。线程池应该没问题,在这里。
线程局部变量也可能是您自己的线程池的参数,但我不确定它在实践中是否相关:
- 使用
std::thread创建一个新线程时没有初始化线程局部变量。也许这不是你想要的。 - 在
async产生的线程中,我有点不清楚,因为线程可以被重用。据我了解,线程局部变量不保证会被重置,但我可能弄错了。 - 另一方面,如果您确实需要,使用您自己的(固定大小)线程池可以让您完全控制。
【问题讨论】:
-
“但是,
std::async(launch::async)似乎有更高的机会被合并。”不,我相信它的std::async(launch::async | launch::deferred)可能会被合并。只需launch::async,无论其他任务正在运行,该任务都应该在新线程上启动。使用launch::async | launch::deferred策略,实现可以选择哪个策略,但更重要的是它可以延迟选择哪个策略。也就是说,它可以等到线程池中的某个线程可用,然后再选择异步策略。 -
据我所知,只有 VC++ 使用
std::async()的线程池。我仍然很想知道它们如何在线程池中支持非平凡的 thread_local 析构函数。 -
@bames53 我浏览了 gcc 4.7.2 附带的 libstdc++,发现如果启动策略不是 exactly
launch::async,那么它会将其视为只有launch::deferred并且从不异步执行它 - 所以实际上,该版本的 libstdc++“选择”始终使用 deferred,除非另有强制。 -
@doug65536 关于 thread_local 析构函数,我的观点是,在使用线程池时,线程退出时的破坏并不完全正确。根据规范,当一个任务异步运行时,它“就像在一个新线程上一样”运行,这意味着每个异步任务都有自己的 thread_local 对象。基于线程池的实现必须特别注意确保共享相同支持线程的任务仍然表现得好像它们有自己的 thread_local 对象。考虑这个程序:pastebin.com/9nWUT40h
-
@bames53 在我看来,在规范中使用“好像在新线程上”是一个巨大错误。
std::async对于性能来说可能是一件美妙的事情——它可能是标准的短期任务执行系统,自然地由线程池支持。现在,它只是一个std::thread加上一些废话,以使线程函数能够返回一个值。哦,他们添加了与std::function的工作完全重叠的冗余“延迟”功能。
标签: c++ multithreading asynchronous c++11 threadpool