【发布时间】:2018-12-10 21:09:54
【问题描述】:
我在 blob 存储中有一组 PDF 文档,我已将其作为数据源添加到我的 Azure 搜索实例。当我索引这些文档时,任何旋转的文本(即横向格式)都不会被索引。这些旋转的页面不是图像,而是文本。如果我旋转文本并重新生成 PDF,我可以搜索旋转的文本。
这是设计使然吗?有没有办法让旋转的文本可搜索?
另一个奇怪的地方 - 原始 PDF 是 v1.3,当我重新生成它(在 Docuprinter 中)时,它生成为 v1.4。有了这个版本,我可以搜索旋转和非旋转的文本。
谢谢!
【问题讨论】:
-
您是否尝试将 PDF 导出为 1.4?这可能是一个限制。