【问题标题】:How to get data for BeautifulSoup Xml Parser如何获取 BeautifulSoup Xml Parser 的数据
【发布时间】:2010-06-21 09:35:14
【问题描述】:

我正在尝试使用 BeautifulSoup 解析 XML 文件。在网上所有的教程中,xml的内容都是这样给出的

xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3"
soup = BeautifulStoneSoup(xml)

但我只想给出 xml 文件的路径。在机械化中,可以使用 get_data() 方法,但它仅适用于 html 文件。有什么建议吗?

【问题讨论】:

    标签: beautifulsoup xml-parsing


    【解决方案1】:

    BeautifulSoup documentation 说:

    “Beautiful Soup 构造函数以字符串(或打开的类似文件的对象)的形式获取 XML 或 HTML 文档。它解析文档并在内存中创建相应的数据结构。”

    在您的问题的表述中,您使用BeautifulStoneSoup,尽管在线文档使用字符串,但构造函数的文档字符串显示:

    “Soup 对象被初始化为‘根标签’,并且提供的标记(可以是字符串或类似文件的对象)被馈送到底层解析器。”

    【讨论】:

      猜你喜欢
      • 2012-12-31
      • 2021-08-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-06-04
      相关资源
      最近更新 更多