【发布时间】:2014-09-16 11:33:41
【问题描述】:
我想用 Beautiful Soup 来解析 html 文件。
我先做的:
from bs4 import BeautifulSoup
但我有错误:
from bs4 import BeautifulSoup
ImportError: No module named bs4
所以我只做了:
import BeautifulSoup
一切都很好。我的问题是:从bs4导入的BeautifulSoup和直接导入的有什么区别? bs4 是 python > 2.7 的内置库吗?
然后我做了:
data = url.openUrl("http://emma-watson.net")
self.soup = BeautifulSoup(data)
links = self.soup.find_all('a')
但我有一个错误:
links = self.soup.find_all('a')
TypeError: 'NoneType' object is not callable
但我不明白我的错误在哪里,因为我从文档中提取了这一行。像soup.find、soup.a、soup 这样的函数。 p 工作正常,那么这个函数有什么问题?
【问题讨论】:
-
你已经安装了 bs3
-
提示:
soup和self.soup引用的值不同。 -
@Kevin 对不起,我的错误,但在我的代码中我有相同的 self.soup,但它仍然不起作用
标签: python python-2.7 html-parsing beautifulsoup