【发布时间】:2019-01-27 10:37:35
【问题描述】:
我正在编写一个 doc 和 docx 解析器。需要获取有关这些格式的文档的各种元数据。例如,对于 docx,我需要获取 XML 代码并继续使用标签。告诉我有助于解决我的问题的解决方案?像 python-docx 这样的解决方案不适合,因为它们只适用于文本。
【问题讨论】:
我正在编写一个 doc 和 docx 解析器。需要获取有关这些格式的文档的各种元数据。例如,对于 docx,我需要获取 XML 代码并继续使用标签。告诉我有助于解决我的问题的解决方案?像 python-docx 这样的解决方案不适合,因为它们只适用于文本。
【问题讨论】: