【发布时间】:2013-08-25 06:12:24
【问题描述】:
ScraperWiki 的最新版本依赖于Poppler(或者 GitHub 是这么说的)。不幸的是,它只指定了如何在 macOS 和 Linux 上获取它,而不是 Windows。
快速谷歌搜索没有什么太大的希望。有谁知道如何在 Windows 上为 ScraperWiki 获取 Poppler?
【问题讨论】:
标签: windows python-2.7 installation poppler scraperwiki
ScraperWiki 的最新版本依赖于Poppler(或者 GitHub 是这么说的)。不幸的是,它只指定了如何在 macOS 和 Linux 上获取它,而不是 Windows。
快速谷歌搜索没有什么太大的希望。有谁知道如何在 Windows 上为 ScraperWiki 获取 Poppler?
【问题讨论】:
标签: windows python-2.7 installation poppler scraperwiki
看起来可以在 https://bitbucket.org/merarischroeder/poppler-for-windows/overview 找到可以使用 Visual Studio 构建的版本
【讨论】:
Poppler Windows 二进制文件可从 ftp://ftp.gnome.org/Public/GNOME/binaries/win32/dependencies/ 获得——但请注意,这些文件并不是最新的。
如果您正在寻找 Python (2.7) 绑定(正如这个问题的标签所示),我过去曾通过 bug report 请求过它们。显然有几个人设法制作了一些东西,但我还没有检查过。
关于最近的(python 绑定无关)poppler Windows 二进制 Google 结果,请参阅http://blog.alivate.com.au/poppler-windows/
最后,有全新的(并且目前非常频繁更新)PyGObject 一体化安装程序(主要旨在为 Windows 提供 PyGObject 内省的 Gtk+3 Python 绑定等),所以如果你就是这样的话寻找,去http://sourceforge.net/projects/pygobjectwin32/files/?source=navbar
【讨论】:
更新 2
更新 1
此网站不再维护。 Poppler 0.68 版本非常 今天过时了。您会发现也为 Windows 编译的最新版本 这里:https://anaconda.org/conda-forge/poppler/files 遗憾的是没有 32位版本,只有64位
...但是这个包包含no dependencies:
Anaconda 人好像有下载包的工具 和所有依赖项。 TAR 包中有一个文件: index.json 列出了它所依赖的包。我下载了 一个一个的依赖关系,是的:这很痛苦。
原答案
可在此处找到最新的 Poppler Windows 二进制文件:
【讨论】:
另一个选项是,如果你已经安装了 MikTeX,那么 poppler 会默认包含在你的 PATH 中。在我的情况下,二进制文件安装在:C:\Program Files\MiKTeX 2.9\miktex\bin\x64
【讨论】:
pdftotext 从 poppler 工具运行相应的命令。
其他答案已链接到 Windows 用户的正确下载页面,但未指定如何为外行安装它们。
转到this page 并下载您选择的二进制文件。在本例中,我们将下载并使用poppler-0.68.0_x86。
将存档文件poppler-0.68.0_x86.7z 解压缩到C:\Program Files。因此,目录结构应如下所示:
C:
└ Program Files
└ poppler-0.68.0_x86
└ bin
└ include
└ lib
└ share
通过执行以下操作将C:\Program Files\poppler-0.68.0_x86\bin 添加到您的系统PATH:单击Windows 开始按钮,搜索Edit the system environment variables,单击Environment Variables...,在System variables 下,查找并双击点击PATH,点击New,然后添加C:\Users\Program Files\poppler-0.68.0_x86\bin,点击OK。
如果您使用终端执行 poppler(例如在命令行中运行 pdf2image),您可能需要重新打开终端才能使 poppler 工作。
完成!
【讨论】:
pdf2image 不起作用,但pdfimage 起作用。那是对的吗?还是我错过了什么?
pdf2image 预计可以使用此解决方案
MSYS2 具有可供安装的最新版本。
如果您不想安装整个环境(或者您想要某种便携式版本),您也可以直接从repository 下载 Poppler,但是您还必须手动处理依赖项。即:libwinpthread,nspr,gcc-libs,nss,curl,brotli,openssl,libidn2,libiconv,nghttp2,@9876543332,@9867654333 libpsl、libjpeg-turbo、lcms2、openjpeg2、libpng、zlib、libtiff、xz和zstd。
【讨论】:
您应该考虑使用Windows Subsystem for Linux (WSL)。
在 Ubuntu 命令行中,运行以下命令:
sudo apt-get updatesudo apt-get upgradesudo apt install poppler-utilspdftocairo -v - 检查安装的版本然后您可以通过两种方式运行 pdftocairo(例如):
pdftocairo ...
wsl pdftocairo...
注意:每个 Ubuntu 版本都有一个默认版本的 poppler。您需要查看说明(互联网上应该有很多),以了解如何在 Ubuntu 上安装最新版本的 poppler-utils。这可能涉及相当多的步骤,这些步骤将从源代码编译。例如,像 https://askubuntu.com/a/722955 这样的东西。然后你可能会遇到很多问题。
Ubuntu 19.04 的最新版本,可以安装 Poppler 74。但是 Ubuntu 18.04 似乎是您目前可以为 WSL 安装的最新版本,并且安装了 Poppler 62。
【讨论】:
在 Windows 上安装 anaconda 后,可以简单地执行:
conda install -c conda-forge poppler
【讨论】:
可在此处找到适用于 Windows x64、Mac OSX-64、Linux-64 位的最新二进制文件
https://anaconda.org/conda-forge/poppler/files
Poppler 0.84 版可在撰写本文时的链接中获得,这是非常最新的。 接受的答案和 Alexey 给出的链接不再指向当前版本的 poppler
更新: 截至 2021 年 3 月 8 日,最佳答案是由 Owen Schwarz 以上https://stackoverflow.com/a/62615998/590388
【讨论】:
Poppler 可通过Chocolatey package 获得:
choco install poppler
默认情况下,Poppler 安装在 C:\ProgramData\chocolatey\lib\poppler 中,并为以下工具自动创建垫片:pdfdetach、pdffonts、pdfimages、pdfinfo、pdfseparate、pdfseparate、pdftohtml、 pdftoppm、pdftops、pdftotext、pdfunite。
要更新 Poppler,请运行:
cup poppler
从main bucket安装:
scoop install poppler
默认情况下,Poppler 安装在 ~\scoop\apps\poppler 中,并为以下工具自动创建垫片:pdfdetach、pdffonts、pdfimages、pdfinfo、pdfseparate、pdftocairo、pdftohtml、 pdftoppm、pdftops、pdftotext、pdfunite。
要更新 Poppler,请运行:
scoop update poppler
正如another answer 中提到的,MiKTeX 目前带有 Poppler 工具,另一个 LaTeX 发行版 TeX Live 也是如此。 来自the guide:
命令行工具。
一些常见的 Unix 命令行程序的 Windows 端口与通常的 TeX Live 二进制文件一起安装。其中包括
gzip、zip、unzip,以及来自 poppler 套件的实用程序(pdfinfo、pdffonts、...)
Poppler 套件默认位于 C:\texlive\<year>\bin\win32 中,如果您可以编译 LaTeX 文档,则应该可以立即使用,因为此位置已由安装程序添加到 PATH。
【讨论】:
https://github.com/oschwartz10612/poppler-windows/releases
我将最新的 Poppler 预构建二进制文件与 Windows 依赖项打包在一起快速存储库。在 conda-forge 和 poppler-feedstock 的帮助下构建。包括最新的 poppler 数据。
【讨论】:
要在 Windows 上简单地安装 Poppler,请执行以下提到的步骤,而无需接触环境变量。
现在转到您要调用 Poppler 进行图像转换的 Python 代码,并使用下面提到的代码 sn-p:
from pdf2image import convert_from_path
pages = convert_from_path('MyPdf.pdf', 500, poppler_path = r'C:\User\Poppler\poppler-0.68.0_x86\poppler-0.68.0\bin')
for page in pages:
page.save('out.jpg', 'JPEG')
【讨论】:
这就是我所做的。
安装msys2
打开 msys2 shell 然后运行:
吃豆人-Syu
pacman -S mingw-w64-x86_64-poppler
打开 MingW64 Shell 并访问 poppler 二进制文件
二进制文件安装在: C:\msys64\mingw64\bin
【讨论】:
安装 Microsoft Visual C++ 构建工具
通过 conda 提示符 conda 安装 poppler:
conda install -c conda-forge poppler
请注意:如果您没有安装 anaconda,可以从这里下载, https://docs.anaconda.com/anaconda/install/windows/
【讨论】:
【讨论】: