【发布时间】:2015-02-05 19:57:42
【问题描述】:
我正在尝试编写一个插件来从 XML 文件中读取数据
test.xml里面有:
<data>
<items>
<item test1="Arabic Words"></item>
<item test2="English Words"></item>
</items>
</data>
代码是:
# coding: utf-8
from xml.dom import minidom
xmldoc = minidom.parse('test.xml')
itemlist = xmldoc.getElementsByTagName('item')
test1 = itemlist[0].attributes['test1'].value
test2 = itemlist[1].attributes['test2'].value
print(test1)
print(test2)
但是我遇到编码问题:无法设置为utf-8。
如何让minidom 解释具有 UTF-8 编码的文件?
【问题讨论】:
-
你试过用
xml.sax解析吗? -
@mr.somebody我想答案是否定的......另外,你没有将它设置为 UTF-8 的问题是什么。您能否发布错误消息或至少显示您的预期结果?