【发布时间】:2016-06-11 10:13:42
【问题描述】:
我正在将带有 Pandoc 的 MS Word 文档 (.docx) 转换为 LaTeX (.tex)。 .docx-文件包含反斜杠和括号,Pandoc 将它们转换为我不想要的相应 LaTeX 命令(例如 \textbackslash)。
如何防止 Pandoc 转换特殊字符?
【问题讨论】:
标签: ms-word latex pandoc file-conversion
我正在将带有 Pandoc 的 MS Word 文档 (.docx) 转换为 LaTeX (.tex)。 .docx-文件包含反斜杠和括号,Pandoc 将它们转换为我不想要的相应 LaTeX 命令(例如 \textbackslash)。
如何防止 Pandoc 转换特殊字符?
【问题讨论】:
标签: ms-word latex pandoc file-conversion
我认为 pandoc 实际上正在做你想做的事。您不能在 LaTeX 中使用纯反斜杠,因为它们会被解释为命令,因此您必须使用 \textbackslash{},这是在 LaTeX 中打印简单纯反斜杠的命令。尝试用 LaTeX 生成 PDF,你就会明白我的意思了。
如果您真的想在 Word 文件中包含 LaTeX 命令,我认为这是不可能的。 (pandoc 怎么知道用户是想写反斜杠还是 LaTeX 命令?)但是,您可以将 word doc 转换为 markdown,调整它(在 pandoc markdown 中,您实际上可以包含raw TeX),然后将其导出到乳胶。
pandoc input.docx -o file.md
# edit file.md now
pandoc file.md -o output.tex
如需更自动化的解决方案,您可以查看pandoc filters。那么如何解决反斜杠的歧义就看你自己了……
【讨论】: