【问题标题】:How to index a Blog as a search engine?如何将博客索引为搜索引擎?
【发布时间】:2010-10-31 22:01:27
【问题描述】:

我想创建一个简单的搜索引擎用于学习目的。

我想知道如何索引一个简单的博客网站

一个博客网站有很多页面,每个页面都有一篇博文。 但在每个页面中也有其他共同点(页眉、页脚、类别块和其他内容)。

在您看来,我怎样才能索引这个博客?

程序语言显然无关紧要。

【问题讨论】:

  • 你为什么要索引它而不是另一个页面?据我所知,Google 会单独对待每个网站,不会识别或关心这些网站是否属于同一个域。
  • 请更具体地提出问题。这是一个完整的研究领域,你在说什么。

标签: php python search search-engine web-crawler


【解决方案1】:

您可以使用非常强大的 Zend Lucene 搜索引擎 (PHP 5)。

http://framework.zend.com/manual/en/zend.search.lucene.html

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-10-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-06-09
    • 1970-01-01
    • 2013-08-01
    • 2011-11-14
    相关资源
    最近更新 更多