【问题标题】:How do I find the number of ACTIVE MEMBERS on a forum?如何找到论坛上的活跃会员数量?
【发布时间】:2010-10-27 04:56:47
【问题描述】:

我正在建立一个论坛统计网站,我需要在几个论坛上查找活跃会员的数量。

许多都列出了“总成员”,但这对我没有帮助。

我认为“活跃”是指在过去 6 个月内至少发帖 5 次的人。

我真的很困惑如何做到这一点。有什么建议吗?

【问题讨论】:

  • 您可以访问这些论坛的数据库吗?
  • 不幸的是,我没有。如果是的话,我可以做一个 php/mysql 脚本,我会很高兴。其他想法?

标签: php statistics usage-statistics


【解决方案1】:

如果您无权访问数据库,则抓取 html 页面、跟踪链接以及从 HTML 本身确定发布日期和发布用户似乎是 gp 的唯一方法。 (HTTPRequestcURL 用于获取,结合DOMDocument / DOMXpath 用于可靠的 HTML 解析和查找显式节点),将其存储在您自己的数据库中。总而言之,这取决于论坛的确切 HTML 布局,并不十分复杂,但工作量很大,而且可能您必须一遍又一遍地重复每个不同论坛的细微变化。

如果论坛有 RSS 提要或其他获取更多结构化内容/数据的方法,则所需的工作量可能会大大减少。

【讨论】:

  • 你知道任何关于如何开始这个的教程或其他信息吗?我对 php 有很好的了解,但这很可能是我迄今为止做过的最困难的事情。
  • 本质上,您正在寻找一个能够使用自定义函数解析特定页面的爬虫。谷歌搜索 'php crawling' 提供了丰富的教程,甚至是大量已构建的类,您可能想尝试其中的一些。对于页面的实际解析:在 Firefox 中使用 Firebug 非常容易为您需要的节点获取 XPath(或创建自己的路径,this is a nice XPath turorial
  • 谢谢你,你很有帮助。我正在使用 PHPCrawler 并添加了一些自定义 DOMDocument 和 DOMXpath 代码来过滤掉所需的数据。然后将其存储在 mysql 数据库中以便于访问。很整洁!
猜你喜欢
  • 2010-10-05
  • 2019-04-25
  • 2015-02-05
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-01-17
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多