【发布时间】:2016-11-28 16:13:27
【问题描述】:
我需要计算形式的标量积
T'*log(T)
T 是一个非常大的 Kronecker 乘积形式
T = 1;
for k=1:100
T = kron(T, p(:,k));
end
其中p 是一个5 x 100 整数矩阵。
由于最终结果是一个标量,我不需要生成克罗内克积数组,可以简单地在线求和。但是,每个p(:,k) 通常都有 ca。 3 个唯一值:这给出了大约 3^100 即 10^47 的总数,这是非常多的组合。
您认为我有可能使用 GPU 或 FPGA 在数周内完成计算吗?
【问题讨论】:
标签: performance gpu fpga