【发布时间】:2012-04-22 01:53:22
【问题描述】:
我正在使用工具链将 markdown 转换为 HMTL5,使用 Pandoc 作为 HTML 内容插入到 WordPress 的可视化编辑器中。
当涉及到插入图像时,WordPress 会放置所谓的shortcode 形式
[caption id="attachment_100" align="aligncenter" width="300" caption="This is an image caption"]
进入 HTML 文本。这并不是真正的降价,而是由 Pandoc 解释的,它将每个 " ... " 对转换为 <q> ... </q> 对以用于 HTML 输出。这在 WordPress 中无法正常工作。
我需要防止转换" ... ",但仅限于那些出现在明确定义的[caption ... ] 方括号内的转换,这些方括号由WordPress 专门放入并且不能与其他内容混淆我放进去的。
我对@987654322@ 或Haskell 的了解还不够,无法编写一个内联paseser/filter 来免除这个文本片段的Pandoc 处理。鉴于我对 Pandoc 和 Haskell 不熟悉,到目前为止,我在 pandoc 邮件列表上收到的建议已经超出了我的想象。
我曾想过编写一个 Perl 过滤器,但出于非常充分的理由强烈反对使用正则表达式。
我在这里询问是否有一种可靠的方法可以将 <q> ... </q> 标签反向替换为 " ... ",仅用于在通过 pandoc 运行后的 [caption ... ] 块中的文本,作为后处理步骤。
有人可以建议我如何解决这个问题吗?
非常感谢。
【问题讨论】: