【问题标题】:Simplest TBB example最简单的 TBB 示例
【发布时间】:2012-05-15 19:06:49
【问题描述】:

谁能给我一个TBB的例子如何:

  1. 设置活动线程的最大计数。
  2. 执行彼此独立并以类的形式呈现的任务,而不是静态函数。

【问题讨论】:

    标签: c++ tbb icc


    【解决方案1】:

    这里有几个完整的例子,一个使用parallel_for,另一个使用parallel_for_each

    2014-04-12 更新:这些显示了我认为现在使用 TBB 的非常老式的方式;我使用带有 C++11 lambda 的 parallel_for 添加了 separate answer

    #include "tbb/blocked_range.h"
    #include "tbb/parallel_for.h"
    #include "tbb/task_scheduler_init.h"
    #include <iostream>
    #include <vector>
    
    struct mytask {
      mytask(size_t n)
        :_n(n)
      {}
      void operator()() {
        for (int i=0;i<1000000;++i) {}  // Deliberately run slow
        std::cerr << "[" << _n << "]";
      }
      size_t _n;
    };
    
    struct executor
    {
      executor(std::vector<mytask>& t)
        :_tasks(t)
      {}
      executor(executor& e,tbb::split)
        :_tasks(e._tasks)
      {}
    
      void operator()(const tbb::blocked_range<size_t>& r) const {
        for (size_t i=r.begin();i!=r.end();++i)
          _tasks[i]();
      }
    
      std::vector<mytask>& _tasks;
    };
    
    int main(int,char**) {
    
      tbb::task_scheduler_init init;  // Automatic number of threads
      // tbb::task_scheduler_init init(2);  // Explicit number of threads
    
      std::vector<mytask> tasks;
      for (int i=0;i<1000;++i)
        tasks.push_back(mytask(i));
    
      executor exec(tasks);
      tbb::parallel_for(tbb::blocked_range<size_t>(0,tasks.size()),exec);
      std::cerr << std::endl;
    
      return 0;
    }
    

    #include "tbb/parallel_for_each.h"
    #include "tbb/task_scheduler_init.h"
    #include <iostream>
    #include <vector>
    
    struct mytask {
      mytask(size_t n)
        :_n(n)
      {}
      void operator()() {
        for (int i=0;i<1000000;++i) {}  // Deliberately run slow
        std::cerr << "[" << _n << "]";
      }
      size_t _n;
    };
    
    template <typename T> struct invoker {
      void operator()(T& it) const {it();}
    };
    
    int main(int,char**) {
    
      tbb::task_scheduler_init init;  // Automatic number of threads
      // tbb::task_scheduler_init init(4);  // Explicit number of threads
    
      std::vector<mytask> tasks;
      for (int i=0;i<1000;++i)
        tasks.push_back(mytask(i));
    
      tbb::parallel_for_each(tasks.begin(),tasks.end(),invoker<mytask>());
      std::cerr << std::endl;
    
      return 0;
    }
    

    两者都在使用 g++ tbb_example.cpp -ltbb 的 Debian/Wheezy (g++ 4.7) 系统上编译(然后使用 ./a.out 运行)

    (请参阅 this question 以将“invoker”替换为 std::mem_fun_refboost::bind)。

    【讨论】:

    • 请注意,tbb::task_scheduler_init 已被英特尔在 GitHub 上的 oneAPI/oneTBB 中删除。 oneapi::tbb::global_control c(oneapi::tbb::global_control::max_allowed_parallelism, 6); 似乎是“新方式”。
    【解决方案2】:

    这是parallel_for 与 lambda 的更现代用法;在 Debian/Wheezy 上编译并运行 g++ -std=c++11 tbb_example.cpp -ltbb &amp;&amp; ./a.out:

    #include "tbb/parallel_for.h"
    #include "tbb/task_scheduler_init.h"
    #include <iostream>
    #include <vector>
    
    struct mytask {
      mytask(size_t n)
        :_n(n)
      {}
      void operator()() {
        for (int i=0;i<1000000;++i) {}  // Deliberately run slow
        std::cerr << "[" << _n << "]";
      }
      size_t _n;
    };
    
    int main(int,char**) {
    
      //tbb::task_scheduler_init init;  // Automatic number of threads
      tbb::task_scheduler_init init(tbb::task_scheduler_init::default_num_threads());  // Explicit number of threads
    
      std::vector<mytask> tasks;
      for (int i=0;i<1000;++i)
        tasks.push_back(mytask(i));
    
      tbb::parallel_for(
        tbb::blocked_range<size_t>(0,tasks.size()),
        [&tasks](const tbb::blocked_range<size_t>& r) {
          for (size_t i=r.begin();i<r.end();++i) tasks[i]();
        }
      );
    
      std::cerr << std::endl;
    
      return 0;
    }
    

    【讨论】:

      【解决方案3】:

      如果您只想同时运行几个任务,使用tbb::task_group 可能更容易。示例取自tbb

      #include "tbb/task_group.h"  
      
      using namespace tbb;
      
      int Fib(int n) {
          if( n<2 ) {
              return n;
          } else {
              int x, y;
              task_group g;
              g.run([&]{x=Fib(n-1);}); // spawn a task
              g.run([&]{y=Fib(n-2);}); // spawn another task
              g.wait();                // wait for both tasks to complete
              return x+y;
          }
      }
      

      请注意

      为单个 task_group 创建大量任务是不可扩展的,因为任务创建成为串行瓶颈。

      在这些情况下,请将 timday 的示例与 parallel_for 或类似名称一起使用。

      【讨论】:

        【解决方案4】:

        1-

         //!
         //! Get the default number of threads
         //!
         int nDefThreads = tbb::task_scheduler_init::default_num_threads();
        
         //!
         //! Init the task scheduler with the wanted number of threads
         //!
         tbb::task_scheduler_init init(nDefThreads);
        

        2-

        也许如果您的代码允许,使用 TBB 运行独立任务的最佳方式是 parallel_invoke。在英特尔开发者专区的博客中,有一篇文章解释了一些并行调用可能有多大帮助的案例。查看this

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2020-03-12
          • 1970-01-01
          • 1970-01-01
          • 2017-09-27
          • 2016-12-17
          • 2019-05-24
          相关资源
          最近更新 更多