• 这是一个由应用重启连接直接而导致数据被锁的问题。
  • 系统大致结构

应用直接中断连接导致数据被锁(生产故障)

  • 基本情况:

    1. 整个架构为了统一管理db连接,共享连接。
    2. 应用通过loadbalance连接db访问层。
    3. db访问层后端代理若干db。
    4. 应用到loadbalance以mysql协议通信。
    5. db访问层到db以JDBC方式通信。
  • 故障: 某些数据库中的表数据相当长一段时间被锁,导致应用某些场景失败。

  • 故障分析:应用开启一个事务的set autocommit=0命令是从app-lb-db访问层-db,期间如果某个事务还未执行完,而app强行中断连接,就会导致app-lb的连接断开,而lb并不直接断开后端的连接,即lb-db访问层-db的连接不会断,从而导致db不会发生回滚操作。而且此事务对某些记录加了锁,于是就会发生某些数据被锁。直到db访问层检测出该连接超过了idle时间才会关闭,并发送回滚命令给db。

  • 解决问题:

① lb在前端连接关闭时要同时关闭同会话的后端连接,并且db访问层要监听lb的连接,一旦关闭则要做回滚操作。

②去掉lb,提供客户端loadbalance,应用一旦关闭连接db访问层也要关闭连接。

========广告时间========

鄙人的新书《Tomcat内核设计剖析》已经在京东销售了,有需要的朋友可以到 https://item.jd.com/12185360.html 进行预定。感谢各位朋友。

为什么写《Tomcat内核设计剖析》

=========================

欢迎关注:

应用直接中断连接导致数据被锁(生产故障)

相关文章:

  • 2021-11-18
  • 2021-10-02
  • 2018-09-13
  • 2021-05-29
  • 2021-04-25
  • 2022-02-16
  • 2022-02-13
猜你喜欢
  • 2021-09-08
  • 2022-12-23
  • 2022-01-01
  • 2022-12-23
  • 2021-12-09
  • 2022-12-23
  • 2021-11-18
相关资源
相似解决方案