【发布时间】:2017-07-21 06:04:08
【问题描述】:
我写了一个小爬虫。以下是我的代码
class ElectronicsSpider(scrapy.Spider):
name = "electronics"
allowed_domains = ["www.olx.com"]
start_urls = ['http://www.olx.com/']
def parse(self, response):
pass
我的问题是,我想使用设置读取名称、allowed_domains 和 start_urls。我怎样才能做到这一点?
我尝试导入
from scrapy.settings import Settings
也试过了
def __init__(self,crawler):
self.settings = crawler.settings
但我没有/错误。帮我阅读蜘蛛的设置?
【问题讨论】:
-
因为
name、allowed_domains等不是设置,而是蜘蛛类属性。如果你需要从你的蜘蛛代码中读取设置,那么你可以只使用self.settings,因为它是由 Scrapy 为你预先填充的。 -
你能帮我实现这个目标吗@Tomáš Linhart
-
我认为我的评论是独立的。如果您需要明确的答案,您需要分享更多关于 从哪里 了解您需要阅读 what 的信息。