【问题标题】:Behavior of Python's time.sleep(0) under linux - Does it cause a context switch?linux下Python的time.sleep(0)的行为——它会导致上下文切换吗?
【发布时间】:2011-09-01 16:38:05
【问题描述】:

这种模式经常出现,但我找不到直接的答案。

一个非关键的、不友好的程序可能会这样做

while(True):
    # do some work

使用其他技术和平台,如果你想让这个程序热运行(使用尽可能多的 CPU 周期)但要礼貌 - 允许其他热运行的程序有效地减慢我的速度,你会经常写:

while(True):
    #do some work
    time.sleep(0)

我已经阅读了关于后一种方法是否会在 python 上实现我希望在 linux 机器上运行的相互矛盾的信息。是否会导致上下文切换,导致我上面提到的行为?

编辑:值得一提的是,我们在 Apple OSX 中尝试了一个小实验(手边没有 linux 机器)。这个盒子有 4 个内核和超线程,所以我们只用了 8 个程序就创建了一个

while(True):
    i += 1

正如预期的那样,活动监视器将 8 个进程中的每一个显示为消耗超过 95% 的 CPU(显然使用 4 个内核和超线程,您总共得到 800%)。然后我们启动了第九个这样的程序。现在所有 9 个都运行在 85% 左右。现在杀死第九个人并用

启动一个程序
while(True):
    i += 1
    time.sleep(0)

我希望这个过程使用接近 0%,而其他 8 个将运行 95%。但相反,所有九个都运行在 85% 左右。所以在 Apple OSX 上, sleep(0) 似乎没有效果。

【问题讨论】:

  • 我相信time.sleep(0) 有点像yield

标签: python multithreading


【解决方案1】:

我从来没有想过这个,所以我写了这个脚本:

import time

while True:
    print "loop"
    time.sleep(0.5)

只是作为一个测试。使用strace -o isacontextswitch.strace -s512 python test.py 运行它会在循环中为您提供以下输出:

write(1, "loop\n", 5)                   = 5
select(0, NULL, NULL, NULL, {0, 500000}) = 0 (Timeout)
write(1, "loop\n", 5)                   = 5
select(0, NULL, NULL, NULL, {0, 500000}) = 0 (Timeout)
write(1, "loop\n", 5)                   = 5
select(0, NULL, NULL, NULL, {0, 500000}) = 0 (Timeout)
write(1, "loop\n", 5)                   = 5
select(0, NULL, NULL, NULL, {0, 500000}) = 0 (Timeout)
write(1, "loop\n", 5)  

select() 是一个系统调用,所以是的,您是上下文切换(从技术上讲,当您更改到内核空间时,实际上不需要上下文切换,但是如果您有其他进程正在运行,那么您在这里所说的是除非您已准备好在文件描述符上读取数据,否则其他进程可以在此之前运行)进入内核以执行此操作。有趣的是,延迟在于选择标准输入。这允许 python 中断您对事件的输入,例如 ctrl+c 输入,如果他们愿意,无需等待代码超时 - 我认为这非常简洁。

我应该注意,这同样适用于time.sleep(0),只是传入的时间参数是{0,0}。而且这种自旋锁定对于非常短的延迟来说并不理想 - multiprocessingthreads 提供了等待事件对象的能力。

编辑:所以我看看 linux 到底做了什么。 do_select (fs\select.c) 中的实现会进行此检查:

if (end_time && !end_time->tv_sec && !end_time->tv_nsec) {
    wait = NULL;
timed_out = 1;
}

if (end_time && !timed_out)
    slack = select_estimate_accuracy(end_time);

换句话说,如果提供了结束时间并且两个参数都为零(!0 = 1 并且在 C 中计算为真),则等待设置为 NULL,并且选择被视为超时。但是,这并不意味着该函数会返回给您;它遍历您拥有的所有文件描述符并调用cond_resched,从而可能允许另一个进程运行。换句话说,发生什么完全取决于调度器;如果您的进程与其他进程相比一直在占用 CPU 时间,则可能会发生上下文切换。如果没有,您所在的任务(内核 do_select 函数)可能会继续执行,直到完成。

不过,我要重申,对其他进程更好的最佳方式通常是使用自旋锁以外的其他机制。

【讨论】:

  • 这很有帮助。我想确保我理解你的结论。 time.sleep(0) 导致上下文切换 - 对吧?但我想也许我的假设是错误的,即这会导致我的程序对其他进程更友好?
  • @Matthew 有两件事 - 有一个上下文切换(切换任务就像切换到另一个进程)和切换到内核模式 - 只是切换到内核模式并不一定意味着你也会给另一个处理 CPU 时间。可能会增加延迟(如果有其他东西在运行)。这个 (sleep(0)) 肯定会让你进入内核模式;这取决于所讨论的内核是否要求不延迟会立即再次唤醒您的程序,或者它是否会寻找其他也在等待 cpu 时间且文件描述符超时的进程。
  • 其实选择 i 不在标准输入上。 select() 的第一个参数是三个集合中的文件描述符的数量......在本例中为 0。这是实现基于纳秒的睡眠时间的技巧。
  • 有人知道sleep(0)在Windows上的效果是不是类似?
【解决方案2】:

我想你已经从@Ninefingers 那里得到了答案,但是在这个答案中,我们将尝试深入研究 python 源代码。

首先python time 模块是用C 实现的,要查看time.sleep 函数实现,您可以查看Modules/timemodule.c。如您所见(并且没有获取所有平台特定的详细信息),此函数会将调用委托给 floatsleep 函数。

现在floatsleep 被设计为在不同的平台上工作,但行为被设计为尽可能相似,但由于我们只对类 unix 平台感兴趣,让我们检查一下that part only,我们应该:

...
Py_BEGIN_ALLOW_THREADS
sleep((int)secs);
Py_END_ALLOW_THREADS

如您所见,floatsleep 正在调用 C sleep 和来自 sleep man page

sleep() 函数将导致调用线程被挂起 从执行到指定的实时秒数 通过参数 seconds 已经过去或 ...

但是等一下,我们不是忘记了 GIL 吗?

这就是Py_BEGIN_ALLOW_THREADSPy_END_ALLOW_THREADS 宏发挥作用的地方(如果您对这两个宏的定义感兴趣,请查看Include/ceval.h),上面的C 代码可以使用这两个宏转换为:

Save the thread state in a local variable.
Release the global interpreter lock.
... Do some blocking I/O operation ... (call sleep in our case)
Reacquire the global interpreter lock.
Restore the thread state from the local variable.

可以在the c-api doc 中找到有关这两个宏的更多信息。

希望这对您有所帮助。

【讨论】:

  • 那么你推荐这个sleep(0)方法来释放一些资源给其他进程吗?
【解决方案3】:

您基本上是在试图篡夺 OS CPU 调度程序的工作。最好直接调用os.nice(100) 通知调度程序您的优先级很低,以便它可以正常工作。

【讨论】:

  • "niceness 为-20 为最高优先级,19 为最低优先级。"en.wikipedia.org/wiki/Nice_(Unix) man 2 nice: "nice 值的范围是+19(低优先级)到-20 (高优先级)。尝试在范围之外设置一个不错的值被限制在范围内。另外,nice 仅适用于类 UNIX 系统(不是通用操作系统),docs.python.org/2/library/os.html#os.nice
  • 你是对的。但是,如果我只想在本地改变美好?我的程序的一部分在 IO 上阻塞,我希望其他部分正常运行。 nice 的问题在于,在增加 niceness 之后,如果没有超级用户权限或 ulimit,就无法再次减少它。 man renice: "非特权用户只能增加 nice value'' (i.e., choose a lower priority) and such changes are irreversible unless (since Linux 2.6.12) the user has a suitable nice'' 资源限制(参见 ulimit(1) 和 getrlimit(2))。
  • @YaroslavNikitenko - 如果它在 IO 上阻塞,它已经没有运行,这是可能的最低优先级。 :-)
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-05-11
  • 1970-01-01
  • 2015-05-18
  • 1970-01-01
相关资源
最近更新 更多