【发布时间】:2016-04-29 15:42:26
【问题描述】:
我想解析一些 URL 并访问该站点并进一步抓取一些数据。
基本上我当前的代码是:
i = 9
while(i < 118):
dict = {'start': i}
url1 = urllib.urlencode(dict)
url2 = urlparse.urljoin('http://intelligencesquaredus.org/debates/past-debates ', url1)
print url2
i = i + 9
产生结果
http://intelligencesquaredus.org/debates/past-debates/start=9
http://intelligencesquaredus.org/debates/past-debates/start=18
http://intelligencesquaredus.org/debates/past-debates/start=27
但我希望链接是
http://intelligencesquaredus.org/debates/past-debates?start=9
任何帮助将不胜感激。 提前致谢
【问题讨论】:
-
你到底想要什么?您有一个 while 循环,这就是您有许多链接的结果的原因。
-
有许多链接的结果很好,这是预期的行为。我只需要格式正确。请再次检查。
-
好的,你想要
?而不是/? -
是的,现在你是对的
-
我建议使用列表表达式:
base_url = "http://intelligencesquaredus.org/debates/past-debates"和[''.join((base_url, '?', 'start=', str(i))) for i in range(9, 118, 9)]