【发布时间】:2021-08-20 14:38:31
【问题描述】:
QA服务sli.do解析页面:
import urllib.request
from bs4 import BeautifulSoup
voting_url = "https://app.sli.do/event/i6jqiqxm/live/questions"
voting_page = urllib.request.urlopen(voting_url)
soup = BeautifulSoup(voting_page, 'lxml')
print(soup.prettify())
for link in soup.find_all('span'):
print(link.get('Linkify'))
print(soup.prettify())返回html-document,但是没有带有标签spanclass="Linkify"的内容,其中包含问题的文本。可以在 Chrome 中找到:https://app.sli.do/event/i6jqiqxm/live/questions
【问题讨论】:
-
你检查过
voting_page的内容吗?您正在寻找的元素是通过 JavaScript 生成的。request和bs4都不能解释或以其他方式执行 JavaScript。因此,这个问题与Using python Requests with javascript pages 重复
标签: python parsing beautifulsoup request urllib