【发布时间】:2011-07-26 23:24:58
【问题描述】:
我正在尝试编写一个小实用程序,它会定期检查并告诉我网页(可能是任何 URL)的内容是否/何时发生了变化。我已经阅读了其他帖子,但他们并没有真正回答我的问题(据我所知)。
我知道静态页面有一个最后修改的标题。但是,动态页面呢?我得到了 Oli 的评论,即存储内容的哈希值是可行的,但这并不是真正的想法,因为页面上可能只是有一个时间戳(生成页面的日期时间)。显然,在这种情况下,即使没有任何重大变化,每个请求的内容也会有所不同。
所以,现在我正在考虑将其与“变化”的百分比联系起来。例如,超过 5% 的更改将导致“更改”逻辑运行。
我很想听听有关如何以有意义的方式可靠地判断页面何时发生更改的任何想法。
【问题讨论】:
标签: .net vb.net http-headers