【发布时间】:2015-01-20 01:14:26
【问题描述】:
我还没有任何使用 ElasticSearch 的经验,但根据我的阅读,我认为它最适合我的需求。我有一个网络抓取工具,它可以抓取某些域的页面。 我想将这些页面提供给 SE,并提供一个前端界面来搜索抓取的内容。我正在构建某种垂直搜索引擎。
但众所周知,一个主机的网页往往只包含一点点独特的内容,很大一部分页面是通用的。每一页的页脚、页眉、菜单等都是一样的。
ElasticSearch 是否具有一些内置智能功能,可以过滤掉常用部分并仅搜索真实内容?
【问题讨论】:
标签: elasticsearch