【发布时间】:2014-11-29 21:58:41
【问题描述】:
我正在使用 Beautiful Soup 从如下所示的 XML 文件中获取一些信息:
<name>Ted</name>
<link>example.com/rss</link>
<link>example2.com/rss</link>
这是我目前尝试读取的整个 XML 文件,用于测试目的。
当我尝试使用 find_all('link') 时,它会返回一个包含以下内容的列表:
[ <link/>, <link/> ]
我似乎在任何文档中都找不到类似的内容,谁能告诉我我做错了什么?
编辑:包括解析代码:
for file in glob.glob("*.xml"):
if file.endswith(".xml"):
f = open(file, 'r');
#Reads in all information about the bot from the file
botFile = f.read()
soup = BeautifulSoup(botFile)
name = soup.find('name').get_text()
links = soup.find_all('link')
for link in links:
print link
【问题讨论】:
-
你是如何用 BeautifulSoup 解析 XML 的?请向我们展示您的代码。
-
我已经编辑了原始帖子以包含代码。如果有帮助,从汤中检索名称就可以了。
-
旁注:我很确定
file.endswith(".xml")检查是不必要的。 -
就像
f.read()电话一样;soup = BeautifulSoup(f)也可以。
标签: python xml beautifulsoup