【发布时间】:2021-01-11 21:37:03
【问题描述】:
我正在尝试抓取 Twitter 帐户图像,我尝试了多种方法,但输出一直给我空列表!
我的代码:
import requests
from bs4 import BeautifulSoup
url = requests.get('https://twitter.com/jack/photo')
soup = BeautifulSoup(url.text, 'lxml')
image = soup.find_all('img')
print(image)
输出:
[]
这是我项目的一部分.. 我尝试了 lxml 并按类查找,但我仍然一无所获,也许我在那里遗漏了一些东西,但我不知道它是什么。 如果有人可以帮助我,我将不胜感激。
提前致谢
【问题讨论】:
-
推特正在使用某种前端框架。当您查看页面的源代码时,我检查了根本没有 img 标签。尝试使用硒
-
是的,我可以使用 selenium,但我希望使用 BeautifulSoup 或 lxml 或 scrapy,但不是 selenium,因为我想将项目托管到 HeroKu,而 selenium 不适合 HeroKu .
标签: python python-3.x web-scraping beautifulsoup lxml