【发布时间】:2020-12-02 02:37:24
【问题描述】:
在我繁忙的 Django 1.8 站点中,由于 gunicorn worker 超时,我收到大量 502 错误:
[2019-06-11 04:56:29 +0000] [6383] [CRITICAL] WORKER TIMEOUT (pid:6550)
[2019-06-11 04:56:31 +0000] [6383] [CRITICAL] WORKER TIMEOUT (pid:6439)
[2019-06-11 04:56:31 +0000] [6383] [CRITICAL] WORKER TIMEOUT (pid:7210)
[2019-06-11 04:56:33 +0000] [6383] [CRITICAL] WORKER TIMEOUT (pid:6429)
[2019-06-11 04:56:46 +0000] [6383] [CRITICAL] WORKER TIMEOUT (pid:6562)
[2019-06-11 04:59:41 +0000] [6383] [CRITICAL] WORKER TIMEOUT (pid:6560)
gunicorn.版本 19.9.0
这是我的 guniconrn.sh 配置
#!/bin/bash
NAME="myapp"
SOCKFILE=/tmp/gunicorn.sock
USER=myuser
GROUP=www-data
NUM_WORKERS=48
DJANGO_SETTINGS_MODULE=myapp.settings
DJANGO_WSGI_MODULE=myapp.wsgi
MAX_REQ=20000
REQ_TIMEOUT=10
LOG_FILE=/var/log/gunicorn/error.log
echo "Starting $NAME as `whoami`"
cd $DJANGODIR
source /home/myuser/.myappenv/bin/activate
export DJANGO_SETTINGS_MODULE=$DJANGO_SETTINGS_MODULE
export PYTHONPATH=$DJANGODIR:$PYTHONPATH
# Create the run directory if it doesn't exist
RUNDIR=$(dirname $SOCKFILE)
test -d $RUNDIR || mkdir -p $RUNDIR
exec /home/myuser/.myappenv/bin/gunicorn ${DJANGO_WSGI_MODULE}:application \
--name $NAME \
--workers $NUM_WORKERS \
--user=$USER --group=$GROUP \
--bind=unix:$SOCKFILE \
--log-level=error \
--log-file $LOG_FILE \
--max-requests=$MAX_REQ \
--timeout=$REQ_TIMEOUT
--worker-class="egg:meinheld
# --worker-class=eventlet
--threads=2000`
服务器有 128GB 的 RAM 和 24 核 CPU。
错误通常发生在负载为+20时
我从NUM_WORKERS、REQ_TIMEOUT、worker-class 和threads 调整了很多参数。但似乎没有一个有太大的影响。所以我的想法已经用完了,感谢您的提示。
【问题讨论】:
-
您的应用程序可能无法及时响应请求。你看过你的 django 日志吗?
-
@Stargazer which django 记录?
-
您的应用程序日志。您将请求时间定义为 10 秒,根据您的观点,这可能会非常短。
-
好吧,之前我尝试过
REQ_TIMEOUT=120,但仍然有很多超时。 -
这就是为什么您需要检查您的观点为什么请求需要这么长时间才能完成。这几乎不是 gunicorn 的错