【发布时间】:2020-07-27 21:35:29
【问题描述】:
例如,假设我有一个包含第 1、2 和 3 列的表。第 1 列包含狗、猫、狗。我想合并第 2 列和第 3 列
chars = ['column2', 'column3']
csv['combined'] = csv[chars].apply(lambda row: ','.join(row.values.astype(str)), axis=1)
现在假设 column2 第 1 行包含 a,第 2 行包含 b,第 3 行包含 c。假设 column3 第 1 行包含 b,第 2 行包含 c,第 3 行包含 a。我想排序并拥有第 1 行显示 (a, b),然后是第 3 行,它也应该是 (a, c)。即使我尝试这样的 sort_values,我也无法让第 3 行中的 a 优先:
csv['combined'] = csv['combined'].sort_values()
最终我想按第 1 列分组,然后聚合。最后我应该看到(dog, a,c), (dog, a,c), and (cat, b, c)
【问题讨论】: