【发布时间】:2021-03-17 00:29:54
【问题描述】:
我有一个 CSV 表格,如下所示:
我需要像这样对它进行分组:
在我所有的CONCURSO 中,只有CIDADE 和UF 发生变化。
我正在尝试这段代码,但它不起作用。
你们能帮帮我吗?
import...
new_df = pd.read_csv(fr'C:\Users\anton\Desktop\Anon\data\swamp\{date}\nao_tratado.csv')
new_df = new_df.groupby(by=['Concurso'], as_index=False).agg(','.join)
new_df = pd.concat([new_df]).to_csv(fr'C:\Users\anton\Desktop\Anon\data\lake\{date}\tratado.csv', index=False)
print('We are done.')
【问题讨论】:
-
所以在你所有的
Concurso之间,只有Cidade和UF变化? -
是的,只有这两列发生了变化。
CONCURSO需要合并成一行,UF和CIDADE需要嵌套在一个单元格中,用逗号分隔值。
标签: python pandas group-by pandas-groupby