【发布时间】:2021-08-23 05:28:15
【问题描述】:
我想把我在以下website的打字测试中的错别字刮掉。
这是我使用的代码
from bs4 import BeautifulSoup
import requests
header = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"
}
n = 798
url = f"https://data.typeracer.com/pit/result?id=|tr:_cephas_|{n}"
page = requests.get(url, headers = header)
soup = BeautifulSoup(page.content, 'lxml')
for List in soup.select("div.replayWord"):
print(List.get_text(strip=True))
我使用了不同的选择器,还使用了 find() 和 find_all() 函数。但我无法得到这个的任何输出。请帮我找出我的问题。
【问题讨论】:
-
您要查找的内容是通过
JS动态呈现的,因此使用bs4模块您将无法提取它,尝试使用selenium可能会奏效! -
你是怎么找到@BhavyaParikh的?
-
当您打印
soup时,您可以通过搜索元素手动找到,如果您刷新向下滚动到分析部分,甚至可以从站点中找到,加载需要几秒钟。
标签: python-3.x web-scraping beautifulsoup python-requests