【发布时间】:2017-12-20 17:10:09
【问题描述】:
我在 2 个大小为 (100 , 128 , 128 ) 的 3d 张量上使用批量矩阵乘法。
import torch
a = torch.randn(100,128,128)
b = torch.randn(100,128,128)
import time
t0 = time.time()
torch.bmm(a,b)
print(time.time() - t0)
0.03233695030212402
现在如果我在 GPU 上做同样的事情需要更长的时间
a = a.cuda()
b = b.cuda()
t0 = time.time()
torch.bmm(a,b)
print(time.time() - t0)
30.574532985687256
为什么在 GPU 上求解需要这么长时间?
我有一个 GTX 1050 Ti 4GB
和处理器核心 i3-6100 3.7Ghz
【问题讨论】: