【发布时间】:2018-11-19 11:58:35
【问题描述】:
我正在尝试使用来自 RSS 提要的一组 xml 文件来解析一个目录。 我有另一个目录的类似代码工作正常,所以我无法找出问题所在。我想退回这些项目,以便将它们写入 CSV 文件。我得到的错误是:
xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 1, column 0
这是我收集 RSS 源的网站:https://www.ba.no/service/rss
它适用于:https://www.nrk.no/toppsaker.rss 和 https://www.vg.no/rss/feed/?limit=10&format=rss&categories=&keywords=
这是此 RSS 的功能:
import os
import xml.etree.ElementTree as ET
import csv
def baitem():
basepath = "../data_copy/bergens_avisen"
table = []
for fname in os.listdir(basepath):
if fname != "last_feed.xml":
files = ET.parse(os.path.join(basepath, fname))
root = files.getroot()
items = root.find("channel").findall("item")
#print(items)
for item in items:
date = item.find("pubDate").text
title = item.find("title").text
description = item.find("description").text
link = item.find("link").text
table.append((date, title, description, link))
return table
我用print(items) 进行了测试,它返回了所有对象。
会不会是XML文件的写法?
【问题讨论】:
标签: python-3.6 elementtree parse-error xml.etree python-os