【问题标题】:Killing entire process tree in ruby在 ruby​​ 中杀死整个进程树
【发布时间】:2020-08-25 16:12:53
【问题描述】:

所以我正在处理一些后台任务,最终不得不生成一个子进程(使用另一个团队提供的二进制文件)。在某些时候,如果超时,我想停止这样的过程。

看起来很简单。

def run!(command, timeout)
  Timeout.timeout(timeout) do
    stdin, stdout, wait_thr = Open3.popen2e(command)
    @pid = wait_thr.pid

    # ... boring and irrelevant...
  end
rescue Timeout::Error
  Process.kill 'TERM', @pid
  Process.wait pid

  raise
end

现在我也很喜欢在我的命令前加上对time 的调用。漂亮的日志和所有。这使得命令类似于这样(MacOS)

gtime -f 'Time spent %E memory used %M' some/binary --with parameters" 

于是我的进程树就变成了这样

ruby (my background job)
 \__ gtime
      \__ some/binary

当然,现在当我杀死子进程时,只有 gtime 被杀死,二进制文件仍然存在。

  1. 如果我可以控制我作为直接子进程使用的可执行文件,我可能可以处理TERM 并终止其直接子进程。但它是time/gtime 所以我显然没有。但也许有一些神秘的参数?
  2. docs 提到进程组,但当然,子进程与我的父进程共享同一个进程组。有没有办法在一个新的进程组中生成一个进程,从而使“杀死整个进程组”选项可行?

我也可以解析ps 输出,构建一个进程树并遍历它一个接一个地杀死进程,但这似乎有点矫枉过正(抱歉)。我在这里缺少一些真正基本的东西吗?

【问题讨论】:

  • “这似乎有点矫枉过正(抱歉)”????不需要道歉

标签: ruby process kill


【解决方案1】:

您可以通过传递pgroup: true 在新的进程组中启动进程:(有关可用选项,请参阅Process.spawn 的文档)

stdin, stdout, wait_thr = Open3.popen2e(command, pgroup: true)

然后,整个进程组可以通过其进程组 ID 被kill-ed,方法是在信号前面加上一个减号:

如果 signal 为负数(或以减号开头),则终止进程组而不是进程。

pgid = Process.getpgid(wait_thr.pid)
Process.kill '-TERM', pgid

【讨论】:

  • 这正是我所说的“缺少一些基本的东西”的意思。谢谢!
【解决方案2】:

您可能想查看pgrep,而不是解析ps 的输出。做一些侦探工作和discovering some code,我们发现了这个方便的功能:

# get child pids ordered by youngest descendants first
def child_processes(pid)
  pids = `pgrep -P #{pid}`.split("\n").map(&:to_i)
  pids.flat_map { |p| child_processes(p) } + pids
end

假设我们有一个这样的进程树(来自我的机器的示例):

 9088 pts/3    Sl+    1:13  \_ ruby smtserver.rb
 9092 pts/3    Sl     0:41      \_ /usr/local/bin/chromedriver --port=9516
 9101 pts/3    Sl    10:36          \_ /usr/lib/chromium-browser/chromium-browser
 9111 pts/3    S      0:00              \_ /usr/lib/chromium-bro ser/chromium-bro
 9113 pts/3    S      0:00              |   \_ /usr/lib/chromium-bro ser/chromium
 9154 pts/3    Sl    14:06              |       \_ /usr/lib/chromium-bro ser/chro
 9187 pts/3    Sl     0:07              |       \_ /usr/lib/chromium-bro ser/chro
 9135 pts/3    Sl     2:08              \_ /usr/lib/chromium-browser/chromium-bro
 9312 pts/3    Sl     4:44              \_ /usr/lib/chromium-browser/chromium-bro

现在做child_processes(9092),我们得到这个:

[9154, 9187, 9113, 9111, 9135, 9312, 9101]

然后,如果需要,您就有足够的信息来单独杀死整棵树。

gtime 的情况下,简单地杀死你的some/binary 就足够了,然后gmtime 将自行退出。假设 some/binary 没有创造更多的孩子,这样的事情应该可以解决你的问题:

rescue Timeout::Error
  Process.kill 'TERM', child_processes(@pid).last
  Process.wait @pid

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-06-08
    • 2014-06-07
    • 1970-01-01
    • 2014-12-03
    • 2011-08-19
    • 1970-01-01
    相关资源
    最近更新 更多