【发布时间】:2018-05-05 04:22:25
【问题描述】:
我决定查看一个网站的源代码,并选择了一个“扩展”类(I found it using view-source,prettify() 显示不同的代码)。我想用这段代码打印出它的所有内容:
import requests
from bs4 import BeautifulSoup
page = requests.get("https://www.quora.com/How-can-I-write-a-bot-using-Python")
soup = BeautifulSoup(page.content, 'html.parser')
print soup.find_all(class_='expanded')
但它只是打印出来:
[]
请帮我找出问题所在。
我已经看到this thread 并尝试按照答案所说的进行操作,但这对我没有帮助,因为此错误出现在终端中:
bs4.FeatureNotFound:找不到具有您请求的功能的树生成器:lxml。需要安装解析器库吗?
【问题讨论】:
-
使用
page.text而不是page.content
标签: python beautifulsoup