【问题标题】:Azure Search Alternative for indexing blobs用于索引 blob 的 Azure 搜索替代方案
【发布时间】:2018-01-22 02:17:16
【问题描述】:

是否有任何基于云的替代 azure 搜索可以索引 azure blob 的内容? (主要是办公室文件)?

我有一个应用程序可以公开很少使用的全文搜索。 Azure 搜索非常适用于 documentdb 等,基本层涵盖了这种用法。

但是,当对 blob 应用索引时,如果这样做,可能一天会搜索几次,那么与堆栈中使用的其他功能相比,成本非常高。

我们还达到了 2gb 的存储限制,但文件限制不到 20%。理想情况下,我们希望增加存储,但如果不通过更新到 S1 单独将存储成本增加 3 倍,这不是一个选择。

目前发现的替代方案是运行 solr 虚拟机或构建我们自己的功能,这可能仍需要虚拟机,因此在这种情况下 solr 会更好。

似乎其他人在成本方面遇到了这个扩展问题,但通常是因为 QPS。在 24 小时内进行几次搜索,我们的 QPS 非常低。

::希望将其保留在 Azure 中。 AWS CloudSearch 计费似乎很适合我们的用例

【问题讨论】:

    标签: azure azure-cognitive-search


    【解决方案1】:

    我在 Azure 搜索工程团队。很遗憾听到定价对您不起作用。正如您所提到的,在 Azure 中运行您自己的 SOLR 或 ElasticSearch 实现当然是一种选择,但我怀疑您寻找 Azure Search 的原因之一是您不希望将搜索管理添加到您的解决方案中。

    如果不知道具体要做什么,就很难进入特定的选项(例如,您是简单地对该内容进行全文搜索,还是做更多的事情,例如分面、过滤等)。让我抛出一个选项。

    你能减小内容大小吗?例如,您是否真的需要在 Azure 搜索中包含所有这些内容,或者您​​是否可以说只是索引此内容中的关键术语和短语,以便您可以识别包含您正在查找的术语的文档?有很多很棒的技术(例如 Word2Vec)非常适合提取术语和短语。

    这样做的另一个优点是这些术语也可用于分面和过滤,然后您可以根据需要从其他商店加载完整内容。

    术语提取的缺点可能不包括您认为重要的一些术语。

    还有很多其他选择,但如果我更了解您想要做什么,也许我可以提供更多帮助。

    利亚姆

    【讨论】:

    • 嗨 Liam,我写了一个几乎相同的问题。就我而言,我只需要新文件的增量索引。正如您所说,您是 Azure 搜索工程师,您能帮帮我吗?关注[stackoverflow.com/questions/49540244/…谢谢你
    猜你喜欢
    • 1970-01-01
    • 2015-07-10
    • 2018-02-09
    • 1970-01-01
    • 2017-09-22
    • 2020-03-03
    • 1970-01-01
    • 2018-04-30
    • 2015-12-08
    相关资源
    最近更新 更多