【发布时间】:2013-11-26 12:13:27
【问题描述】:
我有一个像这样的元组列表
data = [
('r1', 'c1', avg11, stdev11),
('r1', 'c2', avg12, stdev12),
('r2', 'c1', avg21, stdev21),
('r2', 'c2', avg22, stdev22)
]
我想将它们放入一个 pandas DataFrame 中,其中行由第一列命名,列由第二列命名。处理行名的方法似乎类似于pandas.DataFrame([x[1:] for x in data], index = [x[0] for x in data]),但我如何处理列以获得 2x2 矩阵(前一组的输出是 3x4)?有没有更智能的方法来处理行标签,而不是明确地忽略它们?
编辑 看来我需要 2 个数据帧 - 一个用于平均值,一个用于标准偏差,对吗?或者我可以在每个“单元格”中存储一个值列表吗?
【问题讨论】:
-
stackoverflow.com/questions/11415701/… > 的明确副本
-
@EMS 根本没有。我看到了那个问题,他不需要二维旋转。
-
我不同意——我认为您只是不熟悉在 DataFrame 中堆叠数据的正确方法。通常,您希望将第 1 列和第 2 列中的信息 both 用作索引,这样您就可以通过其中任何一个来快速搜索数据。第 2 列中的内容不属于列名,但即使它们属于,这也是一个与您的帖子标题完全不同的问题。我想编辑标题可能会有所帮助(尽管我仍然认为这不是一个有意义的不同问题)。
-
@ely, gt6989b 我将其重新命名为“...来自 (row,col,values) 的元组列表”以清楚说明为什么这不是重复 “...来自元组”
标签: python python-2.7 pandas pivot