【问题标题】:How to properly parse a PDF and read if checkboxes are checked如果选中复选框,如何正确解析 PDF 并阅读
【发布时间】:2018-04-17 07:07:57
【问题描述】:
我正在尝试在服务器端解析 PDF 表单。我尝试了许多 node.js 模块,如 pdf2json、hummus 和 node-pdftk,我能够获取所有文本字段,但如果选中复选框则无法获取。
我一直在测试不同的文件(如this one),而 pdf2json 总是返回一个空字符串作为每个复选框的值,而鹰嘴豆泥给出 true。使用 pdftk,我得到 FieldValue 和 FieldStateOption 字段,并在阅读this answer 时进行比较,但结果似乎都不正确。
谁能给我一些建议,好吗?
【问题讨论】:
标签:
javascript
node.js
pdf
node-pdfkit
hummus.js
【解决方案1】:
看看使用pdffiller 包是否有效。 generateFDFTemplate 方法应该可以解决问题。根据自述文件:
var pdfFiller = require('pdffiller');
var sourcePDF = "test/test.pdf";
// Override the default field name regex. Default: /FieldName: ([^\n]*)/
var nameRegex = null;
var FDF_data = pdfFiller.generateFDFTemplate( sourcePDF, nameRegex, function(err, fdfData) {
if (err) throw err;
console.log(fdfData);
});
将打印出来:
{
"last_name" : "",
"first_name" : "",
"date" : "",
"football" : "",
"baseball" : "",
"basketball" : "",
"hockey" : "",
"nascar" : ""
};
希望这会有所帮助:)