【问题标题】:How to properly parse a PDF and read if checkboxes are checked如果选中复选框,如何正确解析 PDF 并阅读
【发布时间】:2018-04-17 07:07:57
【问题描述】:

我正在尝试在服务器端解析 PDF 表单。我尝试了许多 node.js 模块,如 pdf2json、hummus 和 node-pdftk,我能够获取所有文本字段,但如果选中复选框则无法获取。

我一直在测试不同的文件(如this one),而 pdf2json 总是返回一个空字符串作为每个复选框的值,而鹰嘴豆泥给出 true。使用 pdftk,我得到 FieldValue 和 FieldStateOption 字段,并在阅读this answer 时进行比较,但结果似乎都不正确。

谁能给我一些建议,好吗?

【问题讨论】:

    标签: javascript node.js pdf node-pdfkit hummus.js


    【解决方案1】:

    看看使用pdffiller 包是否有效。 generateFDFTemplate 方法应该可以解决问题。根据自述文件:

    var pdfFiller = require('pdffiller');
    
    var sourcePDF = "test/test.pdf";
    
    // Override the default field name regex. Default: /FieldName: ([^\n]*)/
    var nameRegex = null;  
    
    var FDF_data = pdfFiller.generateFDFTemplate( sourcePDF, nameRegex, function(err, fdfData) {
        if (err) throw err;
        console.log(fdfData);
    });
    

    将打印出来:

    {
        "last_name" : "",
        "first_name" : "",
        "date" : "",
        "football" : "",
        "baseball" : "",
        "basketball" : "",
        "hockey" : "",
        "nascar" : ""
    };
    

    希望这会有所帮助:)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-01-16
      • 2011-06-01
      • 2016-10-31
      • 2010-12-31
      • 1970-01-01
      • 1970-01-01
      • 2013-12-06
      相关资源
      最近更新 更多