【发布时间】:2022-11-18 02:45:57
【问题描述】:
我正在尝试将找到的所有正则表达式字符串写入文本文件。当我运行脚本时,它只将第一个字符串写入文本文件。我错过了什么?感谢您的协助。
import re
import csv
import PyPDF2
#Path to file
CROZER = (r"C:\Users\PC\Documents\Prospect Data\Crozer Invoices\rest of inovices\Crozer.pdf")
#Reading PDF
doc = PyPDF2.PdfFileReader(CROZER)
pages = doc.getNumPages()
#Search Pattern
PO = re.compile(r'PO[:]\s\w{3}\d{0,}|Invoice\s#:\s\d{0,}')
list = []
for i in range(pages):
current_page = doc.getPage(i)
text = current_page.extractText()
#print(text)
if re.findall(PO, text):
CINV = (re.findall(PO, text))
print(CINV)
with open('CI.txt', 'w+', encoding='utf8') as file:
file.write(str(CINV))
我尝试了文件写入但没有结果。
【问题讨论】: