【发布时间】:2018-07-28 14:08:04
【问题描述】:
我正在尝试使用 beautifulsoup 从 xml 文件中解析所有数据集的 ID 我的脚本:
soup = BeautifulSoup(source, "lxml")
doc = soup.find_all('doc')
string = doc.find('str', attrs={"name":"id"})
一旦我运行它来获取每个文档的字符串,我就会出错:
AttributeError: ResultSet 对象没有“find”属性。您可能将项目列表视为单个项目。当你打算调用 find() 时,你调用了 find_all() 吗?
我尝试使用 For 循环,分别使用两种格式的字符串:
for doc in soup.find_all('doc'):
string = doc.find_all('str', attrs={"name":"id"})
OR
string = doc.str
但它只返回一个结果第一个
这是我要解析的 xml 文本:“doc tag 肯定重复了几次”
<doc>
<str name="id"></str>
<str name="version">20110601</str>
<arr name="access"></arr>
<arr name="cf_standard_name"></arr><arr name="cmor_table">
<str name="instance_id"></str>
</doc>
【问题讨论】:
标签: xml parsing beautifulsoup