python xml文件解析及生成xml文件

#解析一个database的xml文件

"""
<databaselist type="database config">
    <database>
        <host>localhost</host>
        <username>root</username>
        <password>11111</password>
        <datasename>wulaoshi</datasename>
    </database>
</databaselist>
"""

#解析xml文件
domtree=parse(\'d:\\pylianxi\\data.xml\')

#获取根节点
datalist=domtree.documentElement

d={}
#获取标签为database的子节点
database=datalist.getElementsByTagName(\'database\')

#database的子节点轮询，过滤掉textNode节点，取出文本值
for i in database[0].childNodes[1::2]:
    tag=i.tagName
    d[tag]=i.childNodes[0].data #childNodes 获取的是一个列表，通过childNodes[0]获取具体对象

print(\'database:\',d)

2、手动写一个xml文件

#写xml

from xml.dom.minidom import *

#创建一个文档对象
doc=Document()

#创建一个根节点
root=doc.createElement(\'managers\')

#根节点添加属性
root.setAttribute(\'company\',\'中体彩\')
print(root.getAttribute(\'company\'))

#根节点加入到tree
doc.appendChild(root)


#创建二级节点
company=doc.createElement(\'gloryroad\')
name=doc.createElement(\'name\')
name.appendChild(doc.createTextNode(\'公司名称\')) #添加文本节点

#创建一个带着文本节点的子节点
ceo=doc.createElement(\'ceo\')
ceo.appendChild(doc.createTextNode(\'吴总\'))  #<ceo>吴总</ceo>

company.appendChild(name) #name加入到company
company.appendChild(ceo)
root.appendChild(company)#company加入到根节点

print(ceo.tagName)

print(doc.toxml())

#存成xml文件
fp=open(\'d:\\pylianxi\\test.xml\',\'w\',encoding=\'utf-8\')
doc.writexml(fp,indent=\'\',addindent=\'\t\',newl=\'\n\',encoding=\'utf-8\')
fp.close()

3、通过字典数据存成xml文件

from xml.dom.minidom import Document
#在内存中创建一个空的文档
doc = Document() 

#创建一个根节点Managers对象
root = doc.createElement(\'Managers\') 

#设置根节点的属性
root.setAttribute(\'company\', \'哈哈科技\') 
root.setAttribute(\'address\', \'科技软件园\') 

#将根节点添加到文档对象中
doc.appendChild(root)
 
managerList = [{\'name\' : \'joy\',  \'age\' : 27, \'sex\' : \'女\'},
               {\'name\' : \'tom\', \'age\' : 30, \'sex\' : \'男\'},
               {\'name\' : \'ruby\', \'age\' : 29, \'sex\' : \'女\'}  ]

for i in managerList :
  nodeManager = doc.createElement(\'Manager\')
  for j in i:
    
    nodeName = doc.createElement(j)
    #给叶子节点name设置一个文本节点，用于显示文本内容
    nodeName.appendChild(doc.createTextNode(str(i[j])))
    
    #将各叶子节点添加到父节点Manager中，
    nodeManager.appendChild(nodeName)

  #最后将Manager添加到根节点Managers中
  root.appendChild(nodeManager)

#开始写xml文档
fp = open(\'d:\\pylianxi\\company11.xml\', \'w\',encoding=\'utf-8\')
doc.writexml(fp, indent=\'\', addindent=\'\t\', newl=\'\n\', encoding="utf-8")
fp.close()

4、使用etree的方式解析xml文件

#etree xml

from xml.etree import ElementTree as ET

\'\'\'
直接解析XML文件并获得根节点

tree = ET.parse(xmlFilePath)

root = tree.getroot()
解析字符串

root = ET.fromstring(fp.read())
\'\'\'

tree=ET.ElementTree(file=\'d:\\pylianxi\\movies.xml\')

root=tree.getroot()

#打印根节点的标签及属性字典
print(root.tag)
print(root.attrib)

#获取子节点movie的标签及属性字典
for i in root:
    print (i.tag)
    print ("********", i.attrib)

print ("*"*50)
print (root[0].tag)
print (root[0].text)  #“打印的内容为一个回车”
print (root[0][0].tag) #第一个movie节点的第一个子标签type
print (root[0][0].text)

print ("*"*50)
for i in tree.iter():  #递归遍历所有子元素
    print (i.tag, i.attrib,i.text)

print ("*"*50)
for elem in tree.iterfind(\'movie/type\'):#或者这种方式./movie/type查找movie下一级节点中的所有type标签,类似xpath查找
    print (elem.tag, elem.text)

print ("*"*50)
print(list(tree.iter(tag=\'stars\')))
for elem in tree.iter(tag=\'stars\'):#在整个树中查找标签为stars的元素
    print (elem.tag, elem.text)


print ("*"*50)
for elem in tree.iterfind(\'*[@title="Ishtar"]\'): #或者movie[@title="Ishtar"] 在下一级节点查找属性为title="Ishtar"的元素
    print (elem.tag, elem.attrib)

print ("-"*50)
root = tree.getroot()                #获取第一级movie元素
print ("root:",root[0].tag  )          #打印第一级movie元素的标签，为movie
print ("subnode:",root[0][0].tag)      #打印第一级movie元素下的第一个子元素标签type
print ("subnode:",root[0][1].tag )     #打印第一级movie元素下的第二个子元素标签format
print ("subnode:",root[0][2].tag )     #打印第一级movie元素下的第三个子元素标签year
print ("subnode:",root[0][3].tag )     #打印第一级movie元素下的第四个子元素标签rating
print ("subnode:",root[0][4].tag ) 

del root[0][4] #删除第一级movie元素下的第五个子元素
del root[0][3] #删除第一级movie元素下的第四个子元素
del root[0][2] #删除第一级movie元素下的第三个子元素
del root[0][1] #删除第一级movie元素下的第二个子元素

del root[3] #删除第四个movie元素
del root[2] #删除第三个movie元素

for i in root:
    print(i.tag,i.attrib)
    for j in i:
        print(\'******\',j.tag,j.text)
#tree.write("d:\\movies.xml")  #将变更的xml文件写入到文件中

5、etree的方式生成xml

#etree 生成一个xml

a = ET.Element(\'elem\')            #生成一个节点elem，没有文本节点
aa = ET.SubElement(a, \'type\')    #生成一个字节点下的子节点child1
aa.text = "a的type子节点"              #在子节点上添加文本节点
aa2 = ET.SubElement(a, \'name\')    #生成一个字节点下的子节点child2
aa2.text=\'a的name子节点\'

b = ET.Element(\'elem_b\')          #生成一个节点elem_b，没有文本节点
b.set(\'company\',\'科技公司\')
bb=ET.SubElement(b,\'type\')
bb.text=\'bb的type子节点\'
bb2=ET.SubElement(b,\'name\')
bb2.text=\'bb的name子节点\'

root = ET.Element(\'root\')         #生成一个节点root
root.extend((a, b))               #将a、b两个变量存储的节点elem和elem1添加到root节点下
tree = ET.ElementTree(root)       #生成节点树
root[0].set(\'foo\', \'bar\')         #设定第一个子元素的属性foo,值为bar


tree.write("d:\\pylianxi\\test.xml",encoding=\'utf-8\')        #将xml文件内容写入到文本文件中,文件格式并不是很漂亮