【发布时间】:2020-06-09 02:26:11
【问题描述】:
我正在尝试获取 instagram 个人资料页面的 html,但是当我使用请求库时,它会获取加载屏幕的 html,并且我想要加载后页面的 html。 这是我的代码:
from bs4 import BeautifulSoup
import requests
source = requests.get("https://www.instagram.com/ethieen/").text
soup = BeautifulSoup(source,"lxml")
body = soup.find("body")
print(body.prettify())
【问题讨论】:
-
我猜页面内容是通过 javascript 加载的,所以你需要一些能理解 javascript 的东西,比如 Selenium。