【发布时间】:2018-11-27 10:17:13
【问题描述】:
我有基于搜索的要求。我能够使用logstash将oracle数据库表索引到elasticsearch中。同样的,我必须索引 png/JPG/PDF 文件,这些文件现在都出现在文件服务器中。
我正在使用弹性搜索 6.2.3 版。任何人都可以对从文件服务器索引文件到弹性搜索有任何想法吗?
目的 - 为什么要索引 png/JPG/PDF:
我必须搜索并显示一些带有产品信息的产品,同时我还必须显示存储在文件服务器中的产品图片。
我具有搜索文档 (pdf) 的功能。所以,如果是用任何关键字搜索,它也应该在文档的内容中进行搜索,并将这些文档作为搜索结果。这里的文档文件路径在数据库中可用,只有文件在文件服务器中可用。
出于这两个目的,我正在寻找索引 png/JPG/PDF 文件。
【问题讨论】:
-
索引二进制数据的目的是什么?你打算索引他们的位置/路径/网址吗?
-
@Val - 我已经更新了我的问题,目的是为什么要寻找索引二进制数据。
-
您能发布您期望的典型查询吗?对我来说,听起来您需要做的就是存储相对于文件服务器的文件路径并进行一些客户端处理以使这些对用户可见。如果你绝对必须检查elastic.co/guide/en/elasticsearch/plugins/current/…,它基于支持tika.apache.org/0.9/formats.html的Apache Tika
标签: elasticsearch indexing elastic-stack