将 pandas 组保存到单独的 CSV 文件中答案

【问题标题】：Save pandas groups to separate CSV files将 pandas 组保存到单独的 CSV 文件中
【发布时间】：2018-11-22 13:29:18
【问题描述】：

是否可以在不使用.to_csv 的情况下将多个df 返回到独立的csv's。使用下面的代码，我手动返回所需的值并将其导出到 csv。如果我只有几个文件要导出，这没关系，但如果有大量文件或文件名不断更改数据集，这可能会很麻烦。

如果您有特定的值列表并将其导出到 csv，是否有更有效的方法来返回所需的值？

import pandas as pd

d = ({
    'C' : ['08:00:00','XX','08:10:00','XX','08:41:42','XX','08:50:00','XX', '09:00:00', 'XX','09:15:00','XX','09:21:00','XX','09:30:00','XX','09:40:00','XX'],
    'D' : ['Home','Home','Home','Home','Away','Away','Shops','Shops','Away','Away','Shops','Shops','Home','Home','Away','Away','Home','Home'],
    'E' : ['Num:','','Num:','','Num:','','Num:','','Num:', '','Num:','','Num:','','Num:', '','Num:', ''],
    'F' : ['1','','1','','1','','1','','1', '','2','','2','','1', '','2',''],   
    'A' : ['A','','A','','A','','A','','A','','A','','A','','A','','A',''],           
    'B' : ['Stop','','Res','','Stop','','Start','','Res','','Stop','','Res','','Start','','Start','']
    })

df = pd.DataFrame(data=d)

#List of designated places
values = ['Home', 'Away', 'Shops']

#Export to csv
Home = df.loc[df['D'] == 'Home'].to_csv('Home.csv')
Away = df.loc[df['D'] == 'Away'].to_csv('Away.csv')
Shops = df.loc[df['D'] == 'Shops'].to_csv('Shops.csv')

【问题讨论】：

抱歉，已修复重复链接。你可能想要这样的东西：stackoverflow.com/questions/45871314/…
好吧，不，这还不够。 1 秒。

标签： python pandas dataframe export-to-csv

【解决方案1】：

使用isin 过滤，然后在“D”上执行groupby 并迭代保存到 CSV。

incl = ['Home', 'Away', 'Shops']    
for k, g in df[df['D'].isin(incl)].groupby('D'):
    g.to_csv(f'{k}.csv')  # '{}.csv'.format(k)

isin 过滤步骤很重要，当且仅当您的类别多于您想要保存的类别时。如果不是这种情况，并且您想保存所有内容，您的解决方案将简化：

for k, g in df.groupby('D'):
    ...

【讨论】：

感谢@coldspeed
这可能是另一个问题，但我可以在导出之前添加新列吗？
@PeterJames123 这取决于您要添加哪些列。你需要做的任何事情都可以在 for 循环中完成。
感谢@coldspeed。我得到了一半的工作stackoverflow.com/q/50831061/9394674