【发布时间】:2021-03-09 18:10:05
【问题描述】:
我有一个如下所示的数据框:
| - | date_x | date_y | date_z |
|---|---|---|---|
| 0 | 2021-02-19 12:26:48+00:00 | 2021-02-19 16:15:21.510000+00:00 | NaT |
| 1 | 2021-02-19 16:16:54+00:00 | 2021-02-10 17:44:01+00:00 | 2021-02-11 10:10:01+00:00 |
| 1 | 2021-02-21 16:17:54+00:00 | 2021-02-20 17:44:01+00:00 | 2021-02-15 10:10:01+00:00 |
我想为每一行逐行计算每一列的顺序:
| - | date_x | date_y | date_z |
|---|---|---|---|
| 0 | 0 | 1 | NaN |
| 1 | 2 | 0 | 1 |
| 1 | 2 | 1 | 0 |
然后获取整个数据框每列的平均顺序:
| - | date_x | date_y | date_z |
|---|---|---|---|
| 0 | 1,33333333333333 | 0,666666666666667 | 0.5 |
我尝试使用 pandas Series.argsort(),但它与 Series.sort_values() 相同,但返回的是索引而不是值。
然后我想到迭代每一行并查找 sort_values 提供的列表的索引,但我确定必须有一个更快、更清洁的解决方案?
谢谢
【问题讨论】: