【发布时间】:2022-05-13 15:15:20
【问题描述】:
我有一个 Pandas 数据框,其中有一列:犯罪类型。该列包含 16 个不同的犯罪“类别”,我想将其可视化为一个词云,词的大小基于它们在数据框中的频率。
我已尝试使用以下代码执行此操作:
要引入数据:
fields = ['Crime type']
text2 = pd.read_csv('allCrime.csv', usecols=fields)
生成词云:
wordcloud2 = WordCloud().generate(text2)
# Generate plot
plt.imshow(wordcloud2)
plt.axis("off")
plt.show()
但是,我收到此错误:
TypeError: expected string or bytes-like object
我能够使用以下代码从完整数据集创建较早的词云,但我希望词云仅从特定列“犯罪类型”(“allCrime.csv”包含大约13 列):
text = open('allCrime.csv').read()
wordcloud = WordCloud().generate(text)
# Generate plot
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
我是 Python 和 Pandas 的新手(通常是编码!),因此我们非常感谢所有帮助。
【问题讨论】:
-
你可能想检查this ...
标签: python pandas dataframe word-cloud