【发布时间】:2016-02-07 16:58:45
【问题描述】:
如何根据在线数据测试scrapy spider。
我现在从this 发帖说可以针对离线数据测试蜘蛛。
我的目标是检查我的蜘蛛是否仍然从页面中提取正确的数据,或者页面是否发生了变化。我通过 XPath 提取数据,有时页面接收和更新,我的刮刀不再工作。我希望测试尽可能接近我的代码,例如。使用spider和scrapy设置,然后加入parse方法。
【问题讨论】:
-
好的,谢谢。这是我的 B 计划,但我仍然想要一个真正的“测试”,因为我想在检查后做更多事情。
-
为您期望的数据值编写一个scrapy管道。如果您的刮刀没有刮取该字段的预期值,那么您应该提出 scrapy DropItem 异常
-
这能解决您的问题吗? --> stackoverflow.com/questions/6456304/scrapy-unit-testing/…
-
听起来不错,我会调查的!谢谢
标签: unit-testing scrapy automated-tests scrapy-spider