【发布时间】:2016-11-19 06:01:16
【问题描述】:
我正在从 PDF 文件中提取文本。这是代码:
<?php
require("PdfToText.php");
$file = 'SamplePF' ;
$pdf = new PdfToText ( "$file.pdf" ) ;
echo ( $pdf -> Text ) ;
?>
此类适用于某些 PDF 文件。 这个类的问题是:
- 对于某些 PDF 文件,它会从随机页面/行中获取文本,而不是 页面顺序。
- 对于某些 PDF 文件,它没有显示任何结果。
- 对于某些 PDF 文件,它只提取一两行。
请提出一些解决方案。谢谢!
【问题讨论】:
-
一些 PDF 文件较旧,不再使用相同的结构。如果您对此有任何疑问,请联系 Adobe,了解他们为什么没有为此发布公共 API。
标签: php pdf text-extraction pdftotext