【发布时间】:2012-05-06 08:27:03
【问题描述】:
我有一个令人尴尬的并行问题,我想在多个处理器上执行。我原以为boost::thread 会自动将新线程发送到新处理器,但它们都在与父进程相同的核心上执行。是否可以让每个线程在不同的处理器上运行,还是我需要 MPI 之类的东西?
我怀疑boost::thread 根本不是一个多处理器工具,我要求它做一些不是为它设计的事情。
编辑:我的问题归结为:为什么所有线程都在一个处理器上执行?有没有办法让boost::thread 将线程发送到不同的处理器?
这是我的代码的相关示例:
size_t lim=1000;
std::deque<int> vals(lim);
std::deque<boost::thread *> threads;
int i=0;
std::deque<int>::iterator it = vals.begin();
for (; it!=sigma.end(); it++, i++) {
threads.push_back(new boost::thread(doWork, it, i));
while (threads.size() >= maxConcurrentThreads) {
threads.front()->join();
delete threads.front();
threads.pop_front();
}
}
while(threads.size()) {
threads.front()->join();
threads.pop_front();
}
应该清楚,doWork 使用参数i 进行一些计算,并将结果存储在vals 中。我的想法是设置maxConncurrentThreads等于可用的核心数量,然后每个线程将使用空闲的核心。我只需要有人确认boost::thread 不能以这种方式工作。
(我想有比使用队列更好的方法来限制并发线程的数量;也可以为此责骂我。)
这是doWork 函数:
void doWork(std::deque<int>::iterator it, int i) {
int ret=0;
int size = 1000; // originally 1000, later changed to 10,000,000
for (int j=i; j<i+size; j++) {
ret+=j;
}
*it=ret;
return;
}
编辑:正如 Martin James 所建议的,问题在于 doWork 函数最初只有 1000 个 int 加法。对于这么小的作业,调度线程比执行线程花费的时间更长,因此只使用了一个处理器。使工作更长(添加 10,000,000 个整数)会产生所需的行为。重点是:boost::thread 将默认使用多个内核,但是如果您的线程做的工作比调度线程少,那么您将看不到多线程的任何好处。
感谢大家帮助我理解这一点。
【问题讨论】:
-
对,多线程和多处理是完全不同的概念,boost::thread支持前者。
-
对我来说听起来像 MPI...欢迎来到我的世界!
-
我认为这与 MPI 无关,他只是将多处理器和多核系统这两个词混为一谈。
-
@juanchopanza 我理解你是说
boost::thread不能将每个线程发送到不同的核心。对吗? -
通常,您可以通过聆听来判断这样的事情是否有效。如果我用 8 个 100% CPU 线程加载我的机器,CPU 风扇会在几秒钟内启动。
标签: c++ multithreading boost parallel-processing boost-thread