【问题标题】:Get content of PDF file in PHP用PHP获取PDF文件的内容
【发布时间】:2016-08-17 00:21:06
【问题描述】:

我有一个动画书 jquery 页面和太多的电子书(pdf 格式)无法显示在上面。我需要隐藏这些 PDF,以便我想用 PHP 获取它的内容并用我的动画书 jquery 页面显示它。 (而不是提供整个 pdf,我想将其作为部分提供)。

有什么方法可以用 PHP 获取 PDF 文件的全部内容? 我需要根据它们的页面将它们分开。

【问题讨论】:

  • Read pdf files with php的可能重复
  • “获取 PDF 文件的全部内容”是什么意思?
  • @Webeng 我的意思是图片和文字

标签: php parsing pdf


【解决方案1】:

您可以使用 PDF Parser (PHP PDF Library) 来提取每个 以及 PDF 中的所有内容。

PDF 解析器库链接http://www.pdfparser.org/

在线演示链接: http://www.pdfparser.org/demo

文档链接: http://www.pdfparser.org/documentation

示例代码:

<?php

// Include Composer autoloader if not already done.
include 'vendor/autoload.php';

// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

$text = $pdf->getText();
echo $text;

?>

关于您问题的另一部分:

如何将您的 PDF 页面转换为图像:

你需要ImageMagickGhostScript

<?php
$im = new imagick('file.pdf[0]');
$im->setImageFormat('jpg');
header('Content-Type: image/jpeg');
echo $im;
?>

[0] 表示page 1

【讨论】:

  • PDF 解析器仅用于获取文本。我还需要获取 PDF 格式的图像。
  • 感谢您的回答,但将 PDF 渲染为图像并不是非常有效的解决方案。它必须在移动设备上可读,并且图像在移动设备上看起来很糟糕。
  • @BerkKaya :似乎那时您可能需要针对页面的特定部分来拍摄图像,但我认为如果动态可行的话,我不这么认为......!如果它解决了您的问题,请将答案标记为已接受。
  • @UmairShahYousafzai : 如何在以相同格式解析后重新生成 pdf。我能够解析但卡住了如何重新生成?
  • @KaushaThakkar:无法从简单文本重新生成 PDF,因为在解析 wysiwug pdf 版本时会变成简单文本...只有当您尝试将 PDF 解析为标记时才有可能文本,然后您可以使用相同的标记文本重建您的 PDF ..!
猜你喜欢
  • 2023-04-09
  • 2010-11-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-01-21
  • 1970-01-01
  • 2018-09-09
  • 2011-04-21
相关资源
最近更新 更多