【发布时间】:2016-10-30 09:51:30
【问题描述】:
我是 Python 初学者,我只想从亚马逊页面中删除产品链接。 例如,我想废弃这个页面 http://www.amazon.com/s/ref=sr_in_-2_p_4_18?me=A3MZ96G5C78IVQ&fst=as%3Aoff&rh=p_4%3AFunKo&ie=UTF8&qid=1477811368 我在 python 中使用了这段代码
from bs4 import BeautifulSoup
import requests
url = "http://www.amazon.com/s/ref=sr_in_-2_p_4_18?me=A3MZ96G5C78IVQ&fst=as%3Aoff&rh=p_4%3AFunKo&ie=UTF8&qid=1477811368"
r = requests.get(url)
soup = BeautifulSoup(r.content, "lxml")
file = open("parseddata.txt", "wb")
links = soup.find_all('a', {'class': 'a-link-normal s-access-detail-page a-text-normal'})
for link in links:
print(link.get('href'))
file.write(href + '\n')
file.close()
我只想将产品标题链接作为输出。谁能告诉我哪里做错了。
【问题讨论】:
-
您希望您的代码做什么以及它实际做什么?您是否收到任何错误消息或警告?结果是否错误?如果是,在什么方面?
-
@Gurpeet Singh 你不应该这样做(如果是为了严肃的事情),希望你知道亚马逊有一个面向开发人员的 api?
标签: python amazon-web-services