【发布时间】:2018-04-23 04:28:35
【问题描述】:
我正在尝试使用数据框重新组合不同类型的数据。
我有一个包含 3 列的数据框:
- 我定义的索引和索引(使用 groupby 命令)
- 一个对参数进行重新组合的参数,比如“valeur1”,我想要一个具有相同索引的参数的平均值(在分组依据之后使用平均值命令)
- 最后一列包含字符串。每个索引只有 1 个字符串,但某些单元格可能包含 nan。
我试图最终获得一个数据帧,其平均值为 1 个参数,具体取决于索引以及与索引一起使用的字符串(字符串列中的 nan 并不重要)。这是一张带有示例的图片或我想要得到的图片:illustration。主要问题是 dataframe.mean 不适用于字符串
到目前为止我使用的代码非常基本:
dataRaw=pd.read_csv('file.csv', sep=';', encoding='latin-1')
data=dataRaw.groupby(index)
databis=data.mean();
任何建议将不胜感激。
谢谢!
【问题讨论】:
标签: python string dataframe mean