【问题标题】:Suppress or remove python tabula-py warnings抑制或删除 python tabula-py 警告
【发布时间】:2018-04-28 13:47:54
【问题描述】:

我有 python 代码使用tabula-py 阅读 PDF 以提取文本,然后通过 tabula-py 将其更改为表格形式。但它给了我一个警告。

Nov 15, 2017 3:40:23 PM org.apache.pdfbox.pdmodel.font.PDSimpleFont toUnicode
WARNING: No Unicode mapping for .notdef (9) in font Helvetica

此警告是针对tabula-py,而Tabula-py 是用Java 编写的。所以我不能简单地使用-W ignore 来抑制上述警告。

有什么办法可以消除或抑制上述警告。

【问题讨论】:

标签: python pdf tabula


【解决方案1】:

【讨论】:

  • 这似乎不起作用我仍然为每个页面得到以下信息:“Picked up _JAVA_OPTIONS: -Djavax.net.ssl.trustStore=C:\Windows\Sun\Java\Deployment\trusted .certs"
【解决方案2】:

试试这个可能会有所帮助:

import warnings
warnings.filterwarnings('ignore')

【讨论】:

  • 在这种情况下,警告来自 java。
  • 正如@BearBrown 所说,警告来自 tabula-java 而warnings 没有帮助。
【解决方案3】:

Tabula 提供了一个内置功能来抑制 java 警告。

在请求中尝试silent=True参数:

tabula.read_pdf("/path/to/sample.pdf", pages="all", silent=True)

Documentation Source

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-03-03
    • 2015-04-11
    • 2019-10-05
    • 2023-03-31
    • 2011-03-31
    • 2019-10-22
    • 2014-12-19
    相关资源
    最近更新 更多