【发布时间】:2017-01-07 18:19:33
【问题描述】:
我正在尝试使用cublas<>gemmBatched 实现类似 scipy.sparse.bsr_matrix 的操作。不幸的是,由于我的 BSR 矩阵不是正方形,因此我无法使用 cusparse 执行此操作。
我是 cublas 的新手,我想知道为 float * Carray[] 使用别名指针(如 pointer aliasing)数组是否可以(正确性和性能方面)
例如
/* given float * out as the real output array */
float * Carray[] = {
out + 1*stride, out + 2*stride, out + 3*stride,
out + 1*stride, out + 2*stride, out + 3*stride,
/* and repeat */
};
另外,虽然我很确定如果我使用别名 Aarray 或 Barray 会是正确的,但对性能有影响吗?
谢谢!
【问题讨论】: