【发布时间】:2020-10-19 07:48:07
【问题描述】:
我有来自消费者调查的数据。在调查中,有一个问题专门询问如何改进与他们希望从送货服务获得的服务列表相关的服务,并且数据是开放式存储的。由于数据是句子,所以我运行了文本挖掘,得到了列中一些名词的列表。数据如下。
因此我的问题是如何计算这些词。我想要每个单词的频率。这可能看起来像这样。
苹果 330 橙色 250 梨180 ...
如何编码以计算列列表中的每个单词?
谢谢
【问题讨论】:
-
你可以使用
df['Text_mining'].explode().value_counts()。