【发布时间】:2021-06-13 05:55:47
【问题描述】:
我有一个包含一些推文的数据框,如下所示:
tweets = pd.Series(['This is a tweet example #help #thankyou',
'Second tweet example #help',
'Third tweet example #help #stackoverflow'])
tweets_df = pd.DataFrame({'Tweets': tweets})
然后我将主题标签放在数据框的另一列中
tweets_df['hashtags'] = tweets_df['Tweets'].apply(lambda twt : re.findall(r"#(\w+)", twt))
现在我想计算它们并将结果放入另一个数据框中。我尝试了以下方法,但没有成功
tweets_df['hashtags'].str.split(expand=True).stack().value_counts()
结果必须是这样的:
#help 2
#thankyou 1
#stackoverflow 1
【问题讨论】:
-
不应该
#help有3?
标签: python-3.x pandas