【发布时间】:2018-04-18 09:29:24
【问题描述】:
我遇到了scrapy 和python 的问题。 我有几个链接。我使用循环在一个脚本中从每个脚本中抓取数据。但是爬取数据的顺序是随机的或者至少与链接不匹配。
所以我无法将每个子页面的 url 与输出的数据匹配。
Like:爬取的url、data1、data2、data3。 Data 1, data2, data3 => 没关系,因为它来自一个循环,但是如何添加到循环当前 url 或者我可以设置链接列表的顺序?就像列表中的第一个被作为第一个被爬取一样,第二个被作为第二个被爬取......
【问题讨论】:
-
您能否向我们提供您的部分代码,以便我们了解问题所在?