【问题标题】:source code for search engine [closed]搜索引擎的源代码 [关闭]
【发布时间】:2011-01-28 01:46:03
【问题描述】:

我想实现一个搜索引擎。在 python 等中有没有可用的源代码... 我知道有像 spinx 等这样的工具,但我想运行我自己的代码。请问有没有源代码。

【问题讨论】:

  • 您想为自己的网站制作搜索蜘蛛/网络爬虫还是搜索引擎?

标签: search-engine web-crawler


【解决方案1】:

也许像PyLucene

【讨论】:

  • 这看起来像是一个 Java 库的包装器,因此 Python 源代码不会有任何有趣的东西。更糟糕的是,它看起来像是由工具生成的。
  • 编写自己的搜索引擎是一项复杂的任务,尤其是如果您需要相关性等功能。
【解决方案2】:

您可以使用Apache Nutch,它是与 Apache Solr 集成的 Web Crawler 和搜索引擎。

它还支持 Hadoop,分布式爬虫。

【讨论】:

    猜你喜欢
    • 2010-09-11
    • 1970-01-01
    • 2013-02-23
    • 2010-11-29
    • 1970-01-01
    • 2020-09-12
    • 1970-01-01
    • 1970-01-01
    • 2010-10-14
    相关资源
    最近更新 更多