【发布时间】:2021-11-14 20:57:46
【问题描述】:
我有一列索引,每个索引都有对应的单词:
| id | word |
|---|---|
| 1 | word1 |
| 1 | word2 |
| 1 | word3 |
| 2 | word4 |
| 2 | word5 |
等等。
我想以这种方式按索引对它们进行分组: 对于 id 1-[word1,word2,word3] 对于 id 2-[word4,word5]
等等
并提取到 CSV 文件
我有这个代码:
df = pd.DataFrame(data)
d={"word":"first"}
df_new = df.groupby(df['id'], as_index=False).aggregate(d).reindex(columns=df['word'])
print (df_new)
df_new.to_csv('test.csv', sep='\t', encoding='utf-8', index=False)
我需要进行哪些更改才能使其正常工作?
提前谢谢你
【问题讨论】:
-
所以您想将所有
word条目与特定id合并到一行中? -
是的,我有 7000 行带有单词的索引
-
试试
df.groupby("id").agg(list)
标签: python pandas list group-by aggregation-framework