【发布时间】:2019-08-23 08:27:10
【问题描述】:
我正在使用 Twitter 数据集 (@realDonaldTrump)。在这个数据集上,我想做一些 NLP 的东西。 现在我想绘制“源”列的数量。 数据框看起来像这样(我裁剪了它):
User Tweet_ID Source
0 @realDonaldTrump 1138445389709885445 Twitter for iPhone
1 @realDonaldTrump 1138444530020245505 Twitter for iPhone
我已经尝试使用groupby().count() 绘制“源”中的所有对象:
%matplotlib inline
import pandas as pd
df_trump = pd.read_csv('@realDonaldTrump_tweets.csv')
df = df_trump
df
df.groupby([df.Source]).count().plot(kind='bar')
我得到了一个不错的情节,但我只希望每个对象都有一个(!)条。并非所有标题都显示。所以在下图中,“Twitter for iPhone”栏应该是一个没有显示数据框标题的栏。
【问题讨论】:
标签: python-3.x nlp bar-chart