【发布时间】:2012-01-27 00:07:05
【问题描述】:
我有一个 csv 文件,其中第一列包含标识符,第二列包含相关数据。标识符被复制任意次数,所以文件看起来像这样。
数据1,123
数据1,345
数据1,432
数据2,654
数据2,431
数据3,947
数据3,673
我想合并记录,为每个标识符生成一条记录并获取。
数据1,123,345,432
数据2,654,431
数据3,947,673
在 python 或 numpy 中是否有有效的方法来执行此操作?由于重复键,字典似乎已失效。目前,我在列表列表中有这些行,然后循环遍历并测试列表中索引 0 处的前一个值的身份,但这非常笨拙。感谢您的帮助。
【问题讨论】:
-
“由于重复的键,字典似乎已失效”我不确定我是否理解为什么这是一个问题。带有值列表的字典不起作用吗?就像在您的示例中一样,很容易做出以
{'data1': [123, 345, 432], 'data2': [654, 431], 'data3': [947, 673]}结尾的东西