【发布时间】:2019-12-25 08:52:27
【问题描述】:
我正在尝试将 Doc/Docx 文件转换为 HTML。到目前为止,我发现使用 LibreOffice 可以在无头模式下实现它。我能够将文档转换为 HTML,并能够使用以下命令(在 osx 中)内嵌图像:
soffice --convert-to html:HTML:EmbedImages file_to_convert
和 在 ubuntu 中,命令是:
libreoffice --convert-to HTML:HTML --outdir ${outputPath} ${file.fullPath}
当文档从 doc 转换为 HTML 时,字体不会以 base64 格式嵌入 HTML 文件中。它创建一个没有嵌入字体的 HTML 文件。是否有任何解决方案可以在 HTML 文件中将字体嵌入为 based64 格式,以使输出的 html 与 doc/docx 内容完全相同?
【问题讨论】:
标签: document libreoffice file-conversion converters