【发布时间】:2019-11-14 15:58:34
【问题描述】:
我正在使用 PDFBox 从 PDF 文件中提取图像并将其提供给另一个图像处理库(可以处理不同的图像格式)。我现在的代码是这样的:
PDImageXObject pdImage;
ByteArrayOutputStream baos = new ByteArrayOutputStream();
BufferedImage image = pdImage.getImage();
ImageIO.write(image, "png", baos);
byte[] imageBytes = baos.toByteArray();
这将获取 PDF 文件中存储的任何内容,并使用 Java 图形将其转换为 PNG。有没有更好的方法来避免转换并以嵌入的任何格式提取图像?我不想降低图像质量(我想通过使用像 PNG 这样的无损格式来缓解?)并产生转换开销。
【问题讨论】:
-
查看ExtractImages.java的源代码,它完全取决于参数。
标签: java pdf image-processing pdfbox