【发布时间】:2017-03-20 23:53:28
【问题描述】:
我正在使用https://github.com/modesty/pdf2json 来解析多个 pdf 文件。它适用于 1 个单个文件,但在尝试加载多个文件时,pdfParser_dataReadyevent 似乎总是使用同一个文件触发。
这是我尝试过的
var PDFParser = require('pdf2json');
var pdfParser = new PDFParser();
var fs = require('fs');
var fileNames = [];
var fileCont = 0;
fs.readdir(fileFolder, function(err, files){
for (var i = files.length - 1; i >= 0; i--) {
if (files[i].indexOf('.pdf') !== -1){
fileNames.push(files[i]);
}
pdfParser.loadPDF(fileNames[fileCont]);
});
pdfParser.on('pdfParser_dataReady', function(data){
//Do all my stuff and insert in db...
fileCont++;
If (fileCont === fileNames.lenght){
for (var i = fileNames.length - 1; i >= 0; i--) {
fs.unlink(fileFolder + fileNames[i]);
}
return res.json({
data: 'ok '
});
}
pdfParser.loadPDF(fileFolder + fileNames[fileCont]);
});
【问题讨论】:
标签: javascript json node.js parsing pdf