【问题标题】:Python - Extract TextPython - 提取文本
【发布时间】:2021-09-26 17:45:37
【问题描述】:

我有一个包含一些文本的文件,我需要从该文件中提取两个值并分配给变量。

第一部分如下所示:

<DOCUMENT>
<TYPE>4
<SEQUENCE>1
<FILENAME>form.xml
<DESCRIPTION>PRIMARY DOCUMENT

基本上我需要提取“form.xml”并将其分配给某个变量。

接下来是这样的:

<rptOwnerId>0001720314</rptOwnerId>

在这种情况下,我需要获取标签之间的值并将其分配给变量。

但我很难找到最好的方法。

谢谢大家!

【问题讨论】:

  • 你找到第二好的方法了吗?
  • XML 解析器有什么问题?有内置的和大量的第三方。
  • 能否请您在一个块中提供文件的全部内容?
  • @a11apurva 这应该没有必要。这甚至是不可取的。

标签: python text extract


【解决方案1】:

试试这个代码

from xml.etree import ElementTree as ET
xml = "<rptOwnerId>0001720314</rptOwnerId>".strip()
value = ET.fromstring(xml).find("rptOwnerId")
if value:
    print(value.text)

希望这会有所帮助。我还建议您查看这篇文章以从头开始理解 XML 解析here

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-07-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多