【发布时间】:2017-09-25 16:38:50
【问题描述】:
我有许多由 supervisord 管理的 Python 工作者,如果它们工作正常,它们应该连续打印到标准输出(在每个完成的任务之后)。但是,它们往往会挂起,而且我们很难找到错误。理想情况下,supervisord 会注意到它们在 X 分钟内没有打印并重新启动它们;这些任务是幂等的,所以非优雅重启很好。是否有任何主管功能或插件可以做到这一点?还是其他类似主管的程序开箱即用?
我们已经使用http://superlance.readthedocs.io/en/latest/memmon.html 在内存使用量猛增时终止,这可以缓解一些挂起,但不会导致内存泄漏的挂起仍会导致工作人员陷入停顿。
【问题讨论】:
标签: background-process supervisord worker