【发布时间】:2023-04-03 09:49:02
【问题描述】:
我正在尝试创建一个计算pptx 文档中单词的函数。问题是我不知道如何只找到这种标签:
<a:t>Some Text</a:t>
当我尝试:print xmlTree.findall('.//a:t'),它返回
SyntaxError: 在前缀映射中找不到前缀“a”
你知道怎么做才能让它发挥作用吗?
这是函数:
def get_pptx_word_count(filename):
import xml.etree.ElementTree as ET
import zipfile
z = zipfile.ZipFile(filename)
i=0
wordcount = 0
while True:
i+=1
slidename = 'slide{}.xml'.format(i)
try:
slide = z.read("ppt/slides/{}".format(slidename))
except KeyError:
break
xmlTree = ET.fromstring(slide)
for elem in xmlTree.iter():
if elem.tag=='a:t':
#text = elem.getText
#num = len(text.split(' '))
#wordcount+=num
【问题讨论】:
标签: python python-2.7 elementtree