【发布时间】:2019-02-14 01:27:59
【问题描述】:
我有一个 coo 格式的 scipy 稀疏矩阵:
from scipy.sparse import coo_matrix
data = np.asarray([[1, 0, 0], [.8, .2, 0], [0, 1, 0], [0.4, 0.3, 0.3]])
data
array([[1. , 0. , 0. ],
[0.8, 0.2, 0. ],
[0. , 1. , 0. ],
[0.4, 0.3, 0.3]])
sparse_matrix = coo_matrix(data)
对于我有一个集群分配的每一列,我想对按集群分配分组的行求和。在此操作期间,我希望保持稀疏格式以解决内存问题。
例子:
labels = ["a", "b", "b"]
预期输出:
1, 0
.8, .2
0, 1
.4, .6
【问题讨论】:
标签: python scipy sparse-matrix