【问题标题】:Keeping applications and infrastructure connected保持应用程序和基础设施连接
【发布时间】:2009-03-11 20:05:13
【问题描述】:

我在一个分为两组的 IT 部门工作。一组开发和管理应用程序,另一组管理公司的基础设施和服务器。我们面临的问题之一是沟通中断。我为应用程序组工作,我遇到的问题之一是当服务器被基础设施关闭或正在刷新数据库时没有收到通知。

是否有人对如何改善两个小组之间的沟通有任何建议,或者对如何跨多个系统(Linux 和 Windows)保持轻量级日志有任何想法?理想情况下,如果我们可以让我们的盒子只在推特上发布它们的状态或其他东西,那就太好了。

感谢您的帮助,

【问题讨论】:

    标签: communication status infrastructure


    【解决方案1】:

    您可以做的一件事来传达服务器状态是让我们的基础架构组设置一个网络监控系统,如Nagios。这将使您的应用程序组中的每个人都能够获得系统中每个服务器状态的快照视图。在进行开发时,拥有这种状态是非常宝贵的。

    Nagios 为您提供网络监控,但也允许您显示系统中特定服务器的预定停机时间。

    您的团队可以做的另一件事是促进与基础架构的沟通,即让您的构建系统报告它当前正在使用哪些服务器来构建和测试您的产品。

    此外,在两个群体的利益相关者之间建立定期会议可能也是一个好主意。如果你们都在互相交谈,即使每周只有 15 分钟,您可能会看到像您上面描述的那样的事件会减少很多。

    【讨论】:

      【解决方案2】:

      我认为这是一个更大的变更控制问题。

      您应该拥有硬件和软件变更控制和批准流程。

      最终,基础架构为您服务 - IT 基础架构的目的是运行应用程序。

      在我目前的大型金融数据公司中,未经客户端和应用程序组的适当授权,服务器不会被触动。这似乎是一个巨大的痛苦,但每台服务器的存在都是有原因的——满足特定的业务目标并运行特定的应用程序。基础设施团队根本没有任何借口可以随意改变事物或扰乱服务器。

      对严重硬件故障的响应可能是一个例外。

      所需的软件和操作系统更新通过计划的维护时段和批准的更改流程进行处理。

      【讨论】:

      • 基础架构团队确实会进行变更控制,而“需要”知道的人知道变更。我正在寻找一种解决方案,让那些关心的人知道如何找出答案。
      • 如果您的服务器出现故障并且您关心 - 您需要知道
      【解决方案3】:

      我也喜欢 Nagios 的想法。如果您想设置更多的通信工具,我会推荐像 Drupal 这样的内容管理系统。

      我们在内部使用 Drupal 在团队之间进行交流。当一个团队关闭服务器时,他们会在 Drupal 中添加一个事件。我们其他人要么将其作为电子邮件、RSS 项目获取,要么仅通过刷新页面来获取。

      【讨论】:

        【解决方案4】:

        实施变更控制流程,为 BOTH 组提交、批准和安排变更。这让每个人都知道发生了什么。这个过程可以是轻量级的,也可以是重量级的。

        【讨论】:

        • 我们确实有变更控制流程,但我认为如果我们必须在每次备份或重新启动开发框时填写文档,它可能会变得更精细。另一方面,我想你可以有更轻量级的东西?
        猜你喜欢
        • 2019-01-27
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2010-10-16
        • 1970-01-01
        • 2016-04-26
        • 1970-01-01
        相关资源
        最近更新 更多