【发布时间】:2016-11-13 05:12:36
【问题描述】:
我有一个格式如下的 pandas df: 输入:
Freq Document TermId
3 A 112
5 A 055
1 C 003
4 D 001
2 B 003
1 D 089
我想将此数据框转换为术语文档矩阵(最好是另一个 pandas df)。实现这一目标的最有效方法是什么?
Ex 输出:
Term/Document A B C D
001 0 0 0 4
003 0 2 1 0
055 5 0 0 0
089 0 0 0 1
112 3 0 0 0
【问题讨论】:
标签: python numpy pandas scikit-learn nltk