【发布时间】:2017-04-23 07:40:33
【问题描述】:
在我的蜘蛛(继承自CrawlSpider)中,我改变了Rule的参数“follow”,但是LinkExtractor的输出链接没有改变。像这样:
rules = [
Rule(CustomLinkExtractor(
allow=[],
deny=[]),
follow=True,
)
]
CustomLinkExtractor 是我的自定义 LinkExtractor
打印链接:
[Link(url='www.example.com', text=u'', fragment='', nofollow=False)]
现在我改变规则:
rules = [
Rule(CustomLinkExtractor(
allow=[],
deny=[]),
)
]
打印链接:
[Link(url='www.example.com', text=u'', fragment='', nofollow=False)]
没有变化!所以我想知道如何更改参数“nofollow”,我认为参数“nofollow”决定是否跟随链接
【问题讨论】:
标签: python-2.7 scrapy