【发布时间】:2019-07-04 01:13:56
【问题描述】:
这是我寻求从 Facebook 公开帖子中获取一些数据的后续问题。这次我正在尝试收集图像元数据(图像的 url)。链接帖子工作正常,但有些帖子返回空数据。我使用了my previous question 的答案中建议的相同方法,但它不适用于下面的示例。将不胜感激建议!
link = "https://www.facebook.com/228735667216/posts/10151653129902217"
res = requests.get(link,headers={'User-Agent':'Mozilla/5.0'})
comment = res.text.replace("-->", "").replace("<!--", "")
soup = BeautifulSoup(comment, "lxml")
image = soup.find("div", class_="uiScaledImageContainer _517g")
img = image.find("img", class_="scaledImageFitWidth img")
href = img["src"]
print(href)
【问题讨论】:
标签: python-3.x web-scraping beautifulsoup html-parsing