如何获取 BeautifulSoup Xml Parser 的数据

【问题标题】：How to get data for BeautifulSoup Xml Parser如何获取 BeautifulSoup Xml Parser 的数据
【发布时间】：2010-06-21 09:35:14
【问题描述】：

我正在尝试使用 BeautifulSoup 解析 XML 文件。在网上所有的教程中，xml的内容都是这样给出的

xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3"
soup = BeautifulStoneSoup(xml)

但我只想给出 xml 文件的路径。在机械化中，可以使用 get_data() 方法，但它仅适用于 html 文件。有什么建议吗？

【问题讨论】：

【解决方案1】：

BeautifulSoup documentation 说：

“Beautiful Soup 构造函数以字符串（或打开的类似文件的对象）的形式获取 XML 或 HTML 文档。它解析文档并在内存中创建相应的数据结构。”

在您的问题的表述中，您使用BeautifulStoneSoup，尽管在线文档使用字符串，但构造函数的文档字符串显示：

“Soup 对象被初始化为‘根标签’，并且提供的标记（可以是字符串或类似文件的对象）被馈送到底层解析器。”

【讨论】：