【发布时间】:2019-09-26 08:31:51
【问题描述】:
我需要阅读 XML 架构文件并仅提取这些元素,它们具有字段 minOccurs="0"。但是我面临的问题是,当 XML Parser 在解析文档时跳过该字段时。
就像我在下面的代码中向您展示的那样。
我有一个示例 XML 文件:
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:sql="urn:schemas-microsoft-com:mapping-schema">
<xsd:include schemaLocation="def.xml"/>
<xsd:element name="MainElementName">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="A">
<xsd:complexType>
<xsd:attribute name="AA" required="False" type="string"/>
</xsd:complexType>
</xsd:element>
<xsd:element name="B" minOccurs="0" maxOccurs="unbounded">
<xsd:complexType>
<xsd:attribute name="BA" type="string"/>
</xsd:complexType>
</xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
然后我用这段代码解析它:
with open(xsd_path, 'r'):
try:
parser = et.XMLParser(remove_blank_text=True)
tree = et.parse(xsd_path, parser)
tmp_text = et.tostring(tree, pretty_print=True, encoding=str)
except IOError as e:
print(e)
我得到了输出:
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:sql="urn:schemas-microsoft-com:mapping-schema">
<xsd:include schemaLocation="def.xml"/>
<xsd:element name="MainElementName">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="A">
<xsd:complexType>
<xsd:attribute name="AA" type="string"/>
</xsd:complexType>
</xsd:element>
<xsd:element name="B">
<xsd:complexType>
<xsd:attribute name="BA" type="string"/>
</xsd:complexType>
</xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
我不知道为什么解析器会跳过属性中的required 字段和元素中的min/maxOccurs。有谁知道如何解决这个问题?
【问题讨论】: