【发布时间】:2023-04-08 10:33:02
【问题描述】:
我们将 RDS mysql 的备份下载到 AWS 实例,然后上传到 S3。正在备份的主机上的数据库中有一个 50GB 的表。
当这个过程开始时,我们其他 AWS 实例上的网络流量会挂起(从字面上看,网络绑定的进程似乎会阻止写入例如基于 AWS 的 RabbitMQ 交换,或者阻止对同一 RDS DB 的单个 sql UPDATE)。当数据库备份完成将自身归档到 S3 时,网络绑定进程会简单地恢复而不会出现错误。
非网络应用不会挂起。大多数(但不是全部)具有连接到该 RDS 实例的进程的 AWS 实例都表现出这种大规模挂起行为。
我们是否达到了一些模糊的 AWS 带宽限制?
【问题讨论】:
-
你有没有考虑过它可能与RDS的负载有关,而不是与网络带宽有关?也许您的 RDS 实例完全忙于备份,这会对客户端执行其他请求产生负面影响。
-
您是否偶然使用了 NAT 实例(而不是 NAT 网关)?
标签: networking amazon-s3 amazon-ec2 amazon-rds