【发布时间】:2012-07-11 09:22:09
【问题描述】:
我真的很想整理一些数据。我有一些数据想使用 Python 在 CSV 中排序。如果有人可以提供帮助,将不胜感激。无法在 Excel 中排序,因为行数太多(>1500 万)。
格式如下:
X,Y,Level,ID,XYID
15.5,16.5,1.6,HB01,15.516.5
15.5,17.5,1.4,HB01,15.517.5
15.5,18.5,1.7,HB01,15.518.5
15.5,19.5,1.6,HB01,15.519.5
15.5,20.5,1.2,HB01,15.520.5
15.5,20.5,1.9,HB02,15.520.5
15.5,20.5,2.5,HB03,15.520.5
15.5,20.5,2.1,HB04,15.520.5
XYID 只是 X 和 Y 的连接文本。我希望对数据进行排序,以便在第二个块中,唯一出来的行如下,因为它具有最高级别(第三列)并且具有相同的XYID
15.5,20.5,2.5,HB03,15.520.5
我希望最终输出是一个 csv 文件,其中显示前四行,因为它们具有不同的 XYID,而新的第 5 行显示最高级别:
X,Y,Level,ID,XYID
15.5,16.5,1.6,HB01,15.516.5
15.5,17.5,1.4,HB01,15.517.5
15.5,18.5,1.7,HB01,15.518.5
15.5,19.5,1.6,HB01,15.519.5
15.5,20.5,2.5,HB03,15.520.5
【问题讨论】:
-
你试过什么?你看过
csv模块吗?我们不是来为你做你的工作的,请告诉我们你在哪里卡住了。 -
您的示例数据的代表性如何?您的整个数据是否也按列顺序排序?