Python：排序列表和保留索引的最快方法答案

【问题标题】：Python: quickest way to sort list and keep indexesPython：排序列表和保留索引的最快方法
【发布时间】：2021-06-15 03:23:30
【问题描述】：

我正在尝试找到对列表进行排序的最快方法。例如，假设我试图对以下列表进行排序

lst = [1, 0, -1, 0.1, 0, 5, 10, 4]

我最后想要的是获得排序列表，但也能够在排序之前知道他们在lst 中的索引是什么。

我目前使用的方法是这样的

lst = [1, 0, -1, 0.1, 0, 5, 10, 4]
lst = list(enumerate(lst))
lst.sort(key = lambda x: x[1], reverse = True)

这样做会给lst = [(6, 10), (5, 5), (7, 4), (0, 1), (3, 0.1), (1, 0), (4, 0), (2, -1)]

现在我不一定需要有元组 (idx, value)，它可以是两个单独的列表。重要的部分是对值进行排序，并且还知道列表lst 中的“原始”索引是什么。例如得到：

lst_val = [10, 5, 4, 1, 0.1, 0, 0, -1]
lst_idx = [6, 5, 7, 0, 3, 1, 4, 2]

现在我想知道是否有更快/更有效的方法来排序，因为我可以有一个包含超过 200,000 个值的列表。

允许使用numpy，但除此之外我认为不允许使用其他模块。

【问题讨论】：

【解决方案1】：

你不使用lst_val = sorted(lst) 然后使用.index() 来查找值的索引。像这样的：

lst = [1, 0, -1, 0.1, 0, 5, 10, 4]
lst_val = sorted(lst)
lst_idx = []

for i in lst_val:
    lst_idx.append(lst.index(i))

【讨论】：

【解决方案2】：

如果您需要显着加速，您必须使用numpy

import numpy as np

np_lst = np.array(lst)

sorted_indices = np_lst.argsort() #array([2, 1, 4, 3, 0, 7, 5, 6])

然后，您可以通过这种方式对数组进行“排序”：

np_lst[sorted_indices]
#array([-1. ,  0. ,  0. ,  0.1,  1. ,  4. ,  5. , 10. ])

您也可以通过以下方式获得它：

np_lst[sorted_indices[::-1]] 
#array([10. ,  5. ,  4. ,  1. ,  0.1,  0. ,  0. , -1. ])

【讨论】：

假设我有一个包含 200,000 个值的列表，如果我必须通过执行 lst = np.array(lst) 将列表转换为 numpy array，使用您的方法会更快吗？然后用np.sort排序？
@needle 我很确定加速很显着
如果我将 lst 创建为 numpy array，然后将值更新到 numpy 数组，您认为会更快吗？
@needle--from Fastest way to grow a numpy numeric array 增长 Python 列表然后在排序之前转换为 numpy 数组而不是增长 numpy 数组会更快。
@needle 迭代地使用numpy.append 总是一个坏主意。尝试这样的事情：numpy.org/devdocs/reference/generated/numpy.loadtxt.html