【发布时间】:2021-07-23 14:55:00
【问题描述】:
所以,我正在尝试将多个 PDF 转换为 CSV。到目前为止,我有一个代码可以进行扫描并将所有内容转换为单个 CSV。但是,我不想将数据转换为一个单独的 CSV,而是希望 Python 为每个处理的 PDF 保存单独的 CSV(这主要是为了识别一个新文件,因为在此之上还有更多用于格式化数据的代码)。我现在有下面的代码,但我找不到保存多个文件的方法。任何帮助将不胜感激。
import os
import pdfplumber
import pandas as pd
directory = r'Folfer Path'
lines = []
for filename in os.listdir(directory):
if filename.endswith(".pdf"):
pdf = os.path.join(directory, filename)
with pdfplumber.open(pdf) as pdf:
pages = pdf.pages
for page in pdf.pages:
text = page.extract_text()
for line in text.split('\n'):
lines.append(line)
print(line)
df = pd.DataFrame(lines)
df.to_csv('Folder Path/ filename.csv')
【问题讨论】: