【问题标题】:Azure Search Index PDF document landscape textAzure 搜索索引 PDF 文档横向文本
【发布时间】:2018-12-10 21:09:54
【问题描述】:

我在 blob 存储中有一组 PDF 文档,我已将其作为数据源添加到我的 Azure 搜索实例。当我索引这些文档时,任何旋转的文本(即横向格式)都不会被索引。这些旋转的页面不是图像,而是文本。如果我旋转文本并重新生成 PDF,我可以搜索旋转的文本。

这是设计使然吗?有没有办法让旋转的文本可搜索?

另一个奇怪的地方 - 原始 PDF 是 v1.3,当我重新生成它(在 Docuprinter 中)时,它生成为 v1.4。有了这个版本,我可以搜索旋转和非旋转的文本。

谢谢!

【问题讨论】:

  • 您是否尝试将 PDF 导出为 1.4?这可能是一个限制。

标签: azure-cognitive-search


【解决方案1】:

这种行为并非设计使然,这是我们需要在文档破解阶段解决的问题。 如果您想跟踪此类问题的解决方案,请创建 UserVoice 请求。 https://feedback.azure.com/forums/263029-azure-search

谢谢! Luis Cabrera - 首席 PM(Azure 搜索)

【讨论】:

    猜你喜欢
    • 2016-12-12
    • 2023-01-05
    • 2016-07-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-09-07
    • 1970-01-01
    相关资源
    最近更新 更多