【发布时间】:2016-12-17 22:56:48
【问题描述】:
我有以下熊猫数据框:
column_01 column_02 value
ccc aaa 1
bbb ddd 34
ddd aaa 98
我需要重新组织数据框,使column_01 包含在column_01 和column_02 之间按字母顺序排列的第一个值。上述示例的输出将是:
column_01 column_02 value
aaa ccc 1
bbb ddd 34
aaa ddd 98
我显然可以通过一次遍历数据帧一行来做到这一点,将column_01 与column_02 进行比较,看看哪个按字母顺序排在第一位,并在必要时交换它们。唯一的问题是数据框非常大(超过 100 万 行),所以这不是一种非常有效的方法。
有没有一种方法可以在不单独遍历每一行的情况下做到这一点?
【问题讨论】:
标签: python sorting pandas dataframe multiple-columns