【发布时间】:2021-07-06 04:18:49
【问题描述】:
我已经阅读了大量其他主题,但找不到解决方案,因此请感谢任何人就如何解决此问题提出的意见!
完成一门 Python 数据工程课程,这个项目是关于网络抓取的。在尝试创建从 XML、CSV 和 JSON 文件中提取数据的函数时,我得到了下面的“AttributeError”。
AttributeError - Traceback(最近一次调用最后一次)在 1 log("提取阶段开始") ----> 2 提取数据 = 提取() 3 log("提取阶段结束") 4 提取数据
在 extract() 29 # 最后,处理所有的xml文件 30 用于 glob.glob("*.xml") 中的 xmlFile: ---> 31 提取数据 = 提取数据.append(xmlExtract(xmlFile), ignore_index=True) 32 33 返回提取数据
在 xmlExtract(xmlFile) 15 根 = 树.getroot() 16 对于根中的人: ---> 17 name = person.find("name").text 18 高度 = 浮动(person.find("height").text) 19 weight = float(person.find("weight").text)
AttributeError: 'NoneType' 对象没有属性 'text'
这是错误所指的代码sn-p:
def xmlExtract(xmlFile):
dframe = pddf(columns=["name", "height", "weight"])
tree = ET.parse(xmlFile)
root = tree.getroot()
for person in root:
name = person.find("name").text
height = float(person.find("height").text)
weight = float(person.find("weight").text)
dframe = dframe.append({"name":name, "height":height, "weight":weight}, ignore_index=True)
return dframe
感谢任何关于从哪里开始的指示。
附: 'pdf' 是从 pandas -from pandas import DataFrame as pddf 独特导入的 pandas.dataframe - 因为我在使用 import pandas as pd 时遇到错误,然后使用 pd.dataframe。
【问题讨论】: