【发布时间】:2015-07-23 14:52:57
【问题描述】:
我最近在学习深度学习,我的朋友向我推荐了 caffe。使用 OpenBLAS 安装后,我按照文档中的教程 MNIST task 进行操作。但后来我发现它超级慢,只有一个 CPU 内核在工作。
问题是我实验室的服务器没有 GPU,所以我必须使用 CPU。
我在谷歌上搜索了一下,得到了一些类似 this 的页面。我试过export OPENBLAS_NUM_THREADS=8 和export OMP_NUM_THREADS=8。但是 caffe 仍然使用一个核心。
如何让 caffe 使用多 CPU?
非常感谢。
【问题讨论】:
-
你是否构建了openblas来使用线程?
-
@Jeff 我只是
make和make install。我找到了page,但它并没有说明任何关于构建它以使用线程的内容。如何构建它以使用线程? -
阅读文档。很清楚。
-
@Jeff 我不得不说我没有找到任何关于使用与
threads相关的参数编译 OpenBLAS 的内容。 -
Github 上有一个 OpenMP 版本的 Caffe,在某些工作负载上可以与 GPU 端口竞争。你可能会尝试找到它。线程化 GEMM 并不总是让 DNN 运行得更快的最佳方式……
标签: multithreading machine-learning neural-network caffe openblas