【发布时间】:2020-08-04 16:04:03
【问题描述】:
我用于抓取 Quora 问题的代码如下:
import requests
from bs4 import BeautifulSoup
import pandas as pd
URL = "https://www.quora.com/What-is-the-best-workout-1"
page = requests.get(URL)
soup = BeautifulSoup(page.text, "html.parser")
print(soup.find_all("span", {"class": "q-box qu-userSelect--text"}))
结果是一个空列表。
问题是page.text 包含的源代码与我在 Quora 上检查元素时得到的源代码不同。
相反,它包含以下text,其中不包含任何<span> 元素
这是我使用Inspect Element时得到的代码
【问题讨论】:
标签: python web-scraping beautifulsoup quora