【问题标题】:Transform FormRecognizer output in Azure Data Factory在 Azure 数据工厂中转换 FormRecognizer 输出
【发布时间】:2022-03-14 13:27:34
【问题描述】:

我想提取 PDF 文件中的表格并将该数据插入输出接收器(CSV \ Azure SQL 等)

我尝试过以下事情

  1. 使用表单识别器常规文档分析自定义 pdf 文档,因为我只想抓取表格

  2. 从 ADF 调用“获取分析结果”REST API 以获取表格数组

现在我想遍历每个表和单元格并将数据插入 Azure SQL 表

我如何有效地做到这一点?

我看到的一种方法是,使用 JSON 解析以及 ADF 中的循环机制来逐行转换表单识别器输出

注意:我已经检查过这篇文章 Extract PDF table data using Azure Form Recognizer

【问题讨论】:

    标签: azure-data-factory azure-data-factory-2 azure-data-factory-pipeline form-recognizer azure-form-recognizer


    【解决方案1】:

    您应该能够使用认知服务 API 和外部调用转换来实现这一点:https://youtu.be/r22nthp-f4g?t=400

    【讨论】:

    • 不调用 Azure Cognitive API 而是直接调用 Form Recognizer API 会怎样?
    猜你喜欢
    • 1970-01-01
    • 2018-10-29
    • 1970-01-01
    • 1970-01-01
    • 2022-06-16
    • 1970-01-01
    • 1970-01-01
    • 2020-03-06
    • 1970-01-01
    相关资源
    最近更新 更多