【发布时间】:2022-01-09 15:38:01
【问题描述】:
我的数据被组织在一个具有以下结构的数据框中
| ID | Post | Platform |
| -------- | ------------------- | ----------- |
| 1 | Something #hashtag1 | Twitter |
| 2 | Something #hashtag2 | Insta |
| 3 | Something #hashtag1 | Twitter |
我已经能够使用以下方法(使用this post)提取和计算主题标签:
df.Post.str.extractall(r'(\#\w+)')[0].value_counts().rename_axis('hashtags').reset_index(name='count')
我现在正在尝试计算每个平台的主题标签操作发生次数。我正在尝试以下方法:
df.groupby(['Post', 'Platform'])['Post'].str.extractall(r'(\#\w+)')[0].value_counts().rename_axis('hashtags').reset_index(name='count')
但是,我收到以下错误:
AttributeError: 'SeriesGroupBy' object has no attribute 'str'
【问题讨论】:
标签: python python-3.x pandas text pandas-groupby