【发布时间】:2018-09-01 05:08:00
【问题描述】:
我有一家公司的年度报告(.pdf 格式),我想使用 python 获取资产负债表和其他相关的年度报告。我尝试使用 PyPDF2 lib,但它正在提取高度非结构化的文本。有什么办法吗??
【问题讨论】:
-
答案是:“总有办法”,现在,您能否更具体一些,并添加您的数据示例和代码 sn-p 以便我们查看您尝试了什么以及发生了什么错了
-
s3-ap-southeast-1.amazonaws.com/bsy/iportal/images/… 的数据,我想在随机页面获取资产负债表。