【发布时间】:2016-02-04 18:57:16
【问题描述】:
如果我使用 python 3.5 运行以下代码
import numpy as np
import time
import theano
A = np.random.rand(1000,10000).astype(theano.config.floatX)
B = np.random.rand(10000,1000).astype(theano.config.floatX)
np_start = time.time()
AB = A.dot(B)
np_end = time.time()
X,Y = theano.tensor.matrices('XY')
mf = theano.function([X,Y],X.dot(Y))
t_start = time.time()
tAB = mf(A,B)
t_end = time.time()
print ("NP time: %f[s], theano time: %f[s] **(times should be close when run
on CPU!)**" %(np_end-np_start, t_end-t_start))
print ("Result difference: %f" % (np.abs(AB-tAB).max(), ))
我得到了输出
NP time: 0.161123[s], theano time: 0.167119[s] (times should be close when
run on CPU!)
Result difference: 0.000000
它说如果时间很接近,这意味着我正在我的 CPU 上运行。
如何在我的 GPU 上运行此代码?
注意:
- 我有一台配备 Nvidia Quadro k4200 的工作站。
- 我已经安装了 Cuda 工具包
- 我已经在 VS2012 上成功完成了一个 cuda vectorAdd 示例项目。
【问题讨论】: