【发布时间】:2022-11-08 18:02:54
【问题描述】:
我有一个包含一些字符串值的列的 excel 文件。其中一些价值不止一个词。例如,我有一个值为“心理健康”的单元格。但是当我创建词云时,它将它分成两个词。如果我想将每一列作为一个观察值,我该怎么办?
df = pd.read_csv(r"C:\Users\.......\jj.csv", encoding='utf8')
df = df["Outcome"]
our_mask = np.array(Image.open("C:\\Users\\.....\\baby.png"))
stopwords = set(STOPWORDS)
wc = WordCloud(background_color = "white", font_path='arial',
colormap='Reds', random_state=1,repeat=True,
collocations=False,
max_words = 150,
stopwords = stopwords,
mask = our_mask,
contour_width = 1,
contour_color = 'Gray').generate(str(df))
#Plotting
plt.imshow(wc, interpolation = 'bilinear')
plt.axis('off')
plt.show()
【问题讨论】:
标签: python