【问题标题】:Extract paragraph or sentence from pdf azure cognitive search从 pdf azure 认知搜索中提取段落或句子
【发布时间】:2022-01-03 20:39:46
【问题描述】:

我有一个存储 PDF 文件的 blob 容器,并且我正在使用 Azure 认知搜索来搜索 pdf 上的单词或内容。当搜索存在于容器中的一个 pdf 中的单词或句子时,Azure 认知搜索将返回 pdf 中存在的全部内容。

  • 有没有一种方法可以从 pdf 中只提取出现单词或句子的句子或段落?
  • 有没有办法突出显示在 pdf 中出现的任何地方传递的输入?
  • 我是否针对以上两点使用了正确的服务?

【问题讨论】:

    标签: azure-blob-storage azure-cognitive-search


    【解决方案1】:

    是的,有一个功能正是您正在寻找的,请参阅highlight 您只需要突出显示内容字段

    POST /indexes/hotels-sample-index/docs/search?api-version=2020-06-30 
        {  
          "search": "sandy beaches",  
          "highlight": "Content"
        }
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-07-15
      • 2022-01-12
      • 1970-01-01
      • 2022-11-03
      • 2020-03-27
      • 2021-10-27
      • 2021-10-18
      相关资源
      最近更新 更多