【发布时间】:2019-10-06 22:08:30
【问题描述】:
当我阅读 pdf 时,我怎样才能只得到这个简单的文本?
CLSAI10608
此代码始终以 CLXXXXXXXX, LEN = 10 开头。
代码:
import PyPDF2
file = open('document.pdf', 'rb')
pdfreader = PyPDF2.PdfFileReader(file)
pageobj = pdfreader.getPage(0)
print(pageobj.extractText())
输出:
【问题讨论】:
标签: python pdf pypdf2 pdf-reader