【发布时间】:2019-01-06 19:59:42
【问题描述】:
试图从this site 的左侧区域获取所有电影海报,但我的脚本只解析第一个并退出。
如何获取所有以.jpg 扩展名结尾的电影海报链接?
from selenium import webdriver
def fetch_image_links(driver,link):
driver.get(link)
for item in driver.find_elements_by_css_selector("a[href^='/title/'] img.loadlate[src$='.jpg']"):
print(item.get_attribute("src"))
if __name__ == '__main__':
url = "https://www.imdb.com/list/ls006385184/"
driver = webdriver.Chrome()
try:
fetch_image_links(driver,url)
finally:
driver.quit()
【问题讨论】:
-
"Licensing IMDb Content; 同意使用机器人和爬虫:如果您有兴趣获得我们将 IMDb 内容用于非个人(包括商业)用途的明确书面许可,请访问我们的内容许可部分或联系我们的许可部门。经我们明确的书面同意,我们确实允许有限使用机器人和爬虫,例如来自某些搜索引擎的机器人和爬虫。如果您有兴趣获得我们在我们网站上使用机器人或爬虫的明确书面许可,请联系我们的许可部门。”
标签: python python-3.x selenium selenium-webdriver web-scraping