【发布时间】:2019-09-28 08:12:27
【问题描述】:
我正在尝试从谷歌搜索结果中抓取产品的 Flipkart 链接。但是,当我尝试通过将链接与文本“flipkart”进行匹配来打印链接时,它不会打印任何内容。我究竟做错了什么?
这里是html结构的一部分:
<div class="r">
<a href="https://www.flipkart.com/redmi-note-7-pro-nebula-red-64-
gb/p/itmferghuf9ky6ru" ping="/url?=https://www.flipkart.com/redmi-
note-7-pro-nebula-red-64-gb/p/itmferghuf9ky6ru&">
查询结果在 div class="r" 下。从那个 div 我试图获取锚标记链接。
这是我的代码
input='note 7 pro'
urllib.parse.quote_plus(input)
html = getHTML('https://www.google.co.in/search?q='+input)
main_div=html.findAll('div', {'class':'r'})
for div in main_div:
link = div.find('a')[href]
if 'flipkart' in link:
print(link)
输出应该是产品的完整 Flipkart 链接。但是程序没有显示任何输出。
【问题讨论】: