【发布时间】:2018-07-18 11:38:12
【问题描述】:
我正在尝试使用 pyPDF2 提取 PDF 文件的标题。输出要么没有,要么标题错误。我也试过使用PDFminer,结果还是一样。我尝试使用 3 个不同的 pdf 文件。有没有更好的方法来更准确地提取标题?
这是我使用的代码:
from PyPDF2 import PdfFileReader
def get_pdf_title(pdf_file_path):
pdf_reader = PdfFileReader(open(pdf_file_path, "rb"))
return pdf_reader.getDocumentInfo().title
title = get_pdf_title('C:/PythonPrograms/Test.pdf')
print(title)
【问题讨论】:
-
您的预期输出是什么? PDF 的标题是什么意思?
标签: python-3.x extraction pdfminer pypdf2