【发布时间】:2015-01-27 00:54:11
【问题描述】:
我正在开发一项服务,现在我需要从 PDF 文件中提取图像。从 Linux 命令行中,我可以使用 Poppler library 提取图像,例如 this:
pdfimages my_file.pdf /tmp/image
由于我使用的是 Python Flask 框架并且我想在 Heroku 上运行我的服务,因此我想使用纯 Python(或任何可以在 Flask 系统中的 Heroku 上运行的库)来提取图像。
那么有人知道我如何在纯 Python 中从 pdf 中提取图像吗?我更喜欢开源解决方案,但如果需要,我愿意为它付费(只要它在我自己的 Heroku 控制下运行)。
【问题讨论】:
-
"Image" = 希望只有位图图像?
标签: python image pdf heroku image-extraction