【发布时间】:2020-01-09 21:56:10
【问题描述】:
我有以下系列:
groups['combined']
0 (28, 1) 1
1 (32, 1) 1
2 (36, 1) 1
3 (37, 1) 1
4 (84, 1) 1
....
Name: combined, Length: 14476, dtype: object
如何将此数据帧转换为.tocoo() 矩阵和.tolil()?
参考combined 列是如何形成的
原始 Pandas 数据框:
import pandas as pdpd.DataFrame({0:[28,32,36,37,84],1: [1,1,1,1,1], 2: [1,1,1,1,1]})。 col 0 有超过 10K 的独特功能,col 1 有 39 个组,col 2 只有 1 个。
【问题讨论】:
-
您阅读过
sparse.coo_matrix文档吗? -
一点点,但没有意义
-
该系列的元素(单元格)是什么?字符串?它们看起来像一个 coo 矩阵的显示。
-
@hpaulj - 这些是来自 pandas 数据框列的构造: pd.DataFrame({0:[28,32,36,37,84],1: [1,1,1,1 ,1], 2: [1,1,1,1,1]}),列 '1' 有 39 个唯一元素。 '0' 列有 10K。 'combined' 是三列的连接 - 包含 col 0 和 col 1 的元组。
-
我怀疑原始数据框列比组合更有用。它们看起来像可以用作
row, col和data参数到coo_matrix的数组。
标签: pandas numpy scipy sparse-matrix