【发布时间】:2020-06-25 23:02:56
【问题描述】:
我有多个文档,在这个例子中假设为 3。 它们每个都包含几个不同的单词,用空格分隔。现在我想计算每个文档的所有单词并将其放入矩阵或数据框中。所以我将特定的文档作为一行,每个单词作为一列,出现次数作为数据框中的数字。请参阅下面的示例
Doc1 = "a b c d"
Doc2 = "a c e f"
Doc3 = "a e f f"
data = {'a': [1,1,1],
'b': [1,0,0],
'c': [1,1,0],
'd': [1,0,0],
'e': [0,1,1],
'f': [0,1,2],
}
df = pd.DataFrame (data)
【问题讨论】:
标签: python word-count