【问题标题】:Timsort execution time in PythonPython中的Timsort执行时间
【发布时间】:2018-11-18 12:56:23
【问题描述】:

我正在研究一些排序算法及其执行时间。我在 Python 中实现了一些算法,我正在测量它们对一些数组进行排序需要多长时间。 我发现 Python 原生实现了 Timsort 作为列表的排序算法。 但是,我想将原生 Timsort 与我在 GitHub (this one) 上找到的实现进行比较。 怎么可能原生实现需要 0.000630140304565 秒才能对 51200 个元素的数组进行排序,而我之前链接的实现需要 40.7546050549 秒才能对同一个数组进行排序?

[编辑] 为了获得时间,我在执行排序算法之前和之后使用“time.time()”,然后我就做出了改变。

我预计本机实现会更快,但不是那么快。事实上,我还在 Python 中实现了其他排序算法,例如,Merge-Sort 需要 0.148133039474 秒来对同一个数组进行排序。 我没想到 Merge-Sort 和 Timsort 的 Python 实现之间有这么大的区别。

[编辑2] 所以问题是我发现的实现效率不高,也不是真正的 Timsort。 抱歉,我刚刚发现 Timsort 是 theta(nlgn),我相信这是正确的实现。现在的问题是:Timsort 的高效 Python 实现是否存在?

【问题讨论】:

  • 你用来计时算法的代码是什么?
  • 一个优点是原生的 timsort 是......它是原生的。它在 C 中运行,而不是 Python:github.com/python/cpython/blob/…
  • 因为python的原生实现是用C写的,然后导入python。相比之下,github排序算法是用纯python编写的。 C 是一种速度更快的语言。
  • 要获得准确的计时,最好使用perf_countertimeit
  • 那里被描述为“timsort”的东西肯定不是timesort。 Timsort 有一个"gallopping mode",但该代码中没有它的踪迹。对我来说,这似乎只是一个伪非常简化的 timsort 变体。

标签: python sorting array-algorithms timsort


【解决方案1】:

2020 年 11 月 24 日

从 2018 年 10 月(在此处提出原始问题之前)开始,一个非常完整且经过测试的 timsort python 实现在这里:

https://gist.github.com/ruminations/89a045dc0ef7edfb92304a0de0752ee0

评论包含用于教育目的的有用链接。

【讨论】:

    猜你喜欢
    • 2015-09-07
    • 1970-01-01
    • 1970-01-01
    • 2021-11-17
    • 2018-03-10
    • 2018-01-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多