【问题标题】:How to index a web site如何索引一个网站
【发布时间】:2010-10-31 17:01:37
【问题描述】:

我是代表某人问的,所以我没有太多细节。

哪些选项可用于索引 ASP.NET 网站中的网站内容?如果页面内容存储在数据库中,我怀疑可能会使用 SQL Server 的全文索引。如果动态和静态内容不存储在数据库中,而是存储在 html 和 aspx 页面本身中,我将如何索引该内容?

【问题讨论】:

    标签: asp.net indexing full-text-indexing


    【解决方案1】:

    几年前我们购买了 Karamasoft Ultimate Search。它是您网站的搜索引擎插件。我喜欢它,因为它是一个简单的工具,可以教会我们在我们的网站上进行搜索。它非常便宜,我们知道如果我们需要更多或不同的功能,我们可以稍后购买。我们需要一些可以让我们搜索而无需进行大量编程的东西。

    具体来说,这个工具是一个网络爬虫。它将在您的网络服务器上运行,它会像最终用户一样在您的网站中导航并记录您的网页,因此当真正的用户搜索时,他们会被告知包含他们想要的内容的页面。

    请记住,它就像最终用户一样,因此您的动态数据与静态数据一起被编入索引,因为它为最终网页编入索引。我们需要这个功能,这是最吸引我们的地方。

     

    【讨论】:

      【解决方案2】:

      您可以使用web crawler 来抓取该站点并将内容添加到数据库中,然后该数据库会被全文索引。那里有许多网络爬虫。

      【讨论】:

        【解决方案3】:

        Lucene 是一个众所周知的开源工具,可以在这里为您提供帮助。主要分支是基于 Java 的,但也有一个 .Net 端口。

        主站:http://lucene.apache.org/ .Net 端口:http://incubator.apache.org/lucene.net/

        【讨论】:

          【解决方案4】:

          使用了几种替代方法后,除了Google Site Search,我不愿意做任何事情。

          我使用 SQL 全文搜索的唯一原因是搜索多个列。很难以任何有效的方式实施它。

          【讨论】:

            猜你喜欢
            • 1970-01-01
            • 2010-12-25
            • 1970-01-01
            • 1970-01-01
            • 2011-05-02
            • 1970-01-01
            • 2010-11-20
            • 1970-01-01
            • 1970-01-01
            相关资源
            最近更新 更多