【发布时间】:2019-01-05 13:12:16
【问题描述】:
我有一个 pdf 文件的输入流。现在我想从 inputStream 中提取所有字符串内容。我发现了以下示例。我应该使用第一个还是第二个?这两者之间有任何性能差异吗? 第二个PDFParser有什么用?
sn-p 1:
PDDocument doc = PDDocument.load(is);
PDFTextStripper stripper = new PDFTextStripper();
String result = stripper.getText(doc);
sn-p 2:
PDFTextStripper stripper = new PDFTextStripper();
PDFParser parser = new PDFParser(newRandomAccessBufferedFileInputStream(stream));
parser.parse();
doc = parser.getPDDocument();
String content = stripper.getText(doc);
提前致谢!!!
【问题讨论】:
标签: java pdfbox text-extraction