【发布时间】:2016-12-06 19:50:39
【问题描述】:
我想知道多少 GPU 计算可以帮助我加快模拟速度。
我的代码的关键部分是矩阵乘法。基本上,代码看起来像下面的 python 代码,矩阵为 1000,for 循环很长。
import numpy as np
m_size = 1000
sim_length = 50
a = np.random.rand(m_size, m_size)
b = np.random.rand(m_size, m_size)
for j in range(sim_length):
result = np.dot(a,b)
注意:我的矩阵很密集,大多是随机的,for 循环是用 cython 编译的。
我天真的猜测是我有两个因素:
- 更多并行线程(当前为 1 级线程,GPU 为 100 级线程?)--> 100 级加速? [Source 已经过时了,从 2011 年开始]
- 较低的处理器频率(当前为 3Ghz,GPU 通常为 2Ghz)--> 忽略
我认为这种观点很幼稚,所以我错过了什么?
【问题讨论】:
-
如果你的 GPU 允许,我建议一个好的起点是 PyCUDA。我过去用 numpy 使用过的很棒的库。
标签: python gpu gpgpu matrix-multiplication