【发布时间】:2022-02-03 02:35:25
【问题描述】:
我想检查来自此记录器的日志消息:[scrapy.spidermiddlewares.httperror] 并基于它,该函数将执行特定操作,所以基本上我想将消息作为字符串分配给一个变量,然后找到一个该字符串中的关键字
在documentation 中我没有找到一种方法来做到这一点,这完全是关于格式化日志
import scrapy
class spider1(scrapy.Spider):
name = 'spider1'
allowed_domains = []
custom_settings = {'CONCURRENT_REQUESTS_PER_DOMAIN': 2}
start_urls = ['https://quotes.toscrape.com/']
def parse(self, response):
print(response.text)
日志示例
2022-02-03 03:11:42 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <402 https://quotes.toscrape.com/>: HTTP status code is not handled or not allowed
我想把上面的日志信息赋值给一个变量
我知道我可以将整个日志输出到一个 .txt 文件,但是由于我将在无限循环中运行多个蜘蛛,因此将有大量数据需要迭代
【问题讨论】: