【发布时间】:2018-11-18 12:56:23
【问题描述】:
我正在研究一些排序算法及其执行时间。我在 Python 中实现了一些算法,我正在测量它们对一些数组进行排序需要多长时间。 我发现 Python 原生实现了 Timsort 作为列表的排序算法。 但是,我想将原生 Timsort 与我在 GitHub (this one) 上找到的实现进行比较。 怎么可能原生实现需要 0.000630140304565 秒才能对 51200 个元素的数组进行排序,而我之前链接的实现需要 40.7546050549 秒才能对同一个数组进行排序?
[编辑] 为了获得时间,我在执行排序算法之前和之后使用“time.time()”,然后我就做出了改变。
我预计本机实现会更快,但不是那么快。事实上,我还在 Python 中实现了其他排序算法,例如,Merge-Sort 需要 0.148133039474 秒来对同一个数组进行排序。 我没想到 Merge-Sort 和 Timsort 的 Python 实现之间有这么大的区别。
[编辑2] 所以问题是我发现的实现效率不高,也不是真正的 Timsort。 抱歉,我刚刚发现 Timsort 是 theta(nlgn),我相信这是正确的实现。现在的问题是:Timsort 的高效 Python 实现是否存在?
【问题讨论】:
-
你用来计时算法的代码是什么?
-
一个优点是原生的 timsort 是......它是原生的。它在 C 中运行,而不是 Python:github.com/python/cpython/blob/…
-
因为python的原生实现是用C写的,然后导入python。相比之下,github排序算法是用纯python编写的。 C 是一种速度更快的语言。
-
要获得准确的计时,最好使用perf_counter或timeit。
-
那里被描述为“timsort”的东西肯定不是timesort。 Timsort 有一个"gallopping mode",但该代码中没有它的踪迹。对我来说,这似乎只是一个伪非常简化的 timsort 变体。
标签: python sorting array-algorithms timsort