【发布时间】:2018-04-28 13:47:54
【问题描述】:
我有 python 代码使用tabula-py 阅读 PDF 以提取文本,然后通过 tabula-py 将其更改为表格形式。但它给了我一个警告。
Nov 15, 2017 3:40:23 PM org.apache.pdfbox.pdmodel.font.PDSimpleFont toUnicode
WARNING: No Unicode mapping for .notdef (9) in font Helvetica
此警告是针对tabula-py,而Tabula-py 是用Java 编写的。所以我不能简单地使用-W ignore 来抑制上述警告。
有什么办法可以消除或抑制上述警告。
【问题讨论】:
-
我使用了参数silent=True。但是,它没有抑制任何警告消息..有人对此有答案吗?
-
PDF文件有问题吗?见issues.apache.org/jira/plugins/servlet/mobile#issue/PDFBOX-3296。你能分享一个产生这个问题的示例 PDF 吗?