【发布时间】:2021-12-31 06:25:39
【问题描述】:
from pandas import DataFrame
import csv
import requests
urllist_404 = []
resplist = []
code_list = []
count = 0
with open('cmsURl.csv1.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
urls = row[1]
request = requests.get(urls)
request_code = request.status_code
count = count + 1
print(count)
if request_code == 404:
urllist_404.append(urls)
resplist.append(request.elapsed)
code_list.append(request_code)
df = DataFrame({'URL': urllist_404, 'Response Code': code_list, 'Response_Time': resplist})
df.to_excel('Error_404_list.xlsx')
我正在尝试制作一个 python 脚本来从超过 10000000 个返回响应代码 404 的 URL 的 CSV 文件中查找 URL,我需要在循环中将新行写入输出 CSV,以便如果程序由于任何原因而关闭,我可以保存结果副本,直到发生故障,任何人都可以建议我如何使它工作
更新的带有try-except块的sn-p,它只运行退出代码为0的脚本,但不写入新的excel文件
from pandas import DataFrame
import csv
import requests
urllist_404 = []
resplist = []
code_list = []
count = 0
with open('BADURLs.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
try:
urls = row[0]
request = requests.get(urls)
request_code = request.status_code
count = count + 1
print(count)
if request_code == 404:
urllist_404.append(urls)
resplist.append(request.elapsed)
code_list.append(request_code)
except:
break
df = DataFrame({'URL': urllist_404, 'Response Code': code_list, 'Response_Time': resplist})
df.to_excel('Error_404_list.xlsx')
【问题讨论】:
-
请在 for 循环和 except 块中添加 try-except 块“添加 break 关键字”并停止循环执行,然后保存结果副本,这将解决您的问题
-
你的问题解决了吗?
-
非常感谢..我试过了,但它不会追加行位 9noy 覆盖第一行你可以更新代码吗??
-
你能更新你尝试过的sn-ps吗?
-
您好,感谢您的帮助,我已经更新了 sn-p,请检查并告诉我这里出了什么问题
标签: python-3.x