【问题标题】:Which Python libraries to use for analyzing doc and docx files?使用哪些 Python 库来分析 doc 和 docx 文件?
【发布时间】:2019-01-27 10:37:35
【问题描述】:

我正在编写一个 doc 和 docx 解析器。需要获取有关这些格式的文档的各种元数据。例如,对于 docx,我需要获取 XML 代码并继续使用标签。告诉我有助于解决我的问题的解决方案?像 python-docx 这样的解决方案不适合,因为它们只适用于文本。

【问题讨论】:

    标签: python docx doc


    【解决方案1】:

    如果您需要原始的docx 数据,您可能会使用它低级,即使用zipfile 打开文件并使用xml etree 读取元数据

    【讨论】:

      猜你喜欢
      • 2017-04-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-08-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多