【问题标题】:Using Datamining/Statistics for Log Monitoring使用数据挖掘/统计进行日志监控
【发布时间】:2010-10-08 07:47:24
【问题描述】:

我有大量的日志文件,我想描述或可能添加某种决策树或某种分析。但我不知道具体是什么。你对日志文件做了什么样的分析,大量的日志文件。

例如,到目前为止,我正在收集对给定日志文件的特定页面发出的请求数。

Servlet = 60 个请求 Servlet2 = 70 个请求,等等。

我猜就在那里,只过滤最流行的请求。此外,在 2 小时内可能会执行 60 个请求。 60 / 160 分钟。

【问题讨论】:

  • 它们是什么样的日志文件? Apache、/var/log/messages、Windows 事件等...?
  • 你是如何在一个新问题上悬赏的?

标签: statistics data-mining


【解决方案1】:

决定进行何种分析取决于您尝试根据该分析做出哪些决定。例如,我目前监控我们的应用程序报告的异常日志(客户端应用程序中的所有异常都记录在服务器上)以确定哪些应该是高优先级的客户端错误来调查。我还使用日志搜索软件来监控我们的服务器软件报告的任何可能需要立即调查的异常。除了一切生成的日志之外,我还使用一些监控软件来跟踪我们的 Web 服务器和数据库服务器的使用情况,这些服务器在数据库中记录使用情况统计信息等。这样做的最终目的是预测未来的使用水平并酌情购买更多硬件以满足需求。

我一直在使用的两个(免费)工具是:

Hyperic 用于监控,它很容易设置,并且可能能够开始记录您可能感兴趣的大量数据,即网络服务器上的每秒请求数。

Splunk 用于搜索日志文件,它非常易于设置和使用,并为您提供了出色的日志文件搜索功能。如果您现在正在使用日志文件并且还没有尝试过 splunk,我绝对推荐它。我注意到在我们的主要生产服务器上使用它时有几个 100% cpu 的时刻,所以最近停止在那台机器上运行它,只是一个警告。

不确定您进行此分析的目的是什么,我一直非常关注寻找我应该知道的任何错误,并计划未来的容量需求。如果你对后者感兴趣,我也推荐The Art of Capacity Planning

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-05-15
    • 2018-10-23
    • 2010-10-28
    • 2011-11-22
    • 2012-06-21
    • 2016-06-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多