【发布时间】:2011-01-28 01:46:03
【问题描述】:
我想实现一个搜索引擎。在 python 等中有没有可用的源代码... 我知道有像 spinx 等这样的工具,但我想运行我自己的代码。请问有没有源代码。
【问题讨论】:
-
您想为自己的网站制作搜索蜘蛛/网络爬虫还是搜索引擎?
我想实现一个搜索引擎。在 python 等中有没有可用的源代码... 我知道有像 spinx 等这样的工具,但我想运行我自己的代码。请问有没有源代码。
【问题讨论】:
也许像PyLucene?
【讨论】:
您可以使用Apache Nutch,它是与 Apache Solr 集成的 Web Crawler 和搜索引擎。
它还支持 Hadoop,分布式爬虫。
【讨论】: