【发布时间】:2019-10-30 03:32:40
【问题描述】:
我正在尝试将 html 文件转换为 docx 我尝试了 pandoc,但它似乎无法添加样式,所以有什么方法可以将其转换为带有样式的 docx?
编辑:我使用 pygments 突出显示一些代码并希望在 docx 文件中获取它,但似乎 pygments 不支持 docx 输出格式,所以我得到了 html 的输出
【问题讨论】:
标签: python html docx pandoc pygments
我正在尝试将 html 文件转换为 docx 我尝试了 pandoc,但它似乎无法添加样式,所以有什么方法可以将其转换为带有样式的 docx?
编辑:我使用 pygments 突出显示一些代码并希望在 docx 文件中获取它,但似乎 pygments 不支持 docx 输出格式,所以我得到了 html 的输出
【问题讨论】:
标签: python html docx pandoc pygments
没有。来自the pandoc MANUAL:
由于 pandoc 对文档的中间表示不如它在其之间转换的许多格式具有表现力,因此不应期望每种格式之间都能完美转换。 Pandoc 尝试保留文档的结构元素,但不保留诸如边距大小之类的格式细节。
但是,您可以使用 --reference-doc option 和 custom styles 来设置 docx 输出的样式。
【讨论】:
您可以使用 python-docx 将整个 html 文档嵌入为 altChunk。
【讨论】: