【发布时间】:2014-04-13 18:21:27
【问题描述】:
我正在尝试将文本文件(来自 Dokuwiki)转换为 XML 以进行进一步处理。为此,我需要将一些特殊的格式字符串转换为开始和结束标签。
例如:标题用“===”("=== Headline of article ===")标记。但我不能简单地将"===" 替换为“<head>”,因为我需要第二个"===" 为“</head>”(结束标记)。我希望你明白我的意思。我必须根据前一个字符串用两个不同的字符串替换相同的字符串。程序应该是用 Python 写的,但我其实只需要算法……
谢谢
【问题讨论】:
-
让 Dokuwiki 的解析器完成这项工作怎么样?例如,在 python 中,您可以使用 urllib 来检索 xhtml 文档。它符合您的需要吗?
-
不,它没有。但我自己找到了一个合适的解决方案:pastebin.com/pFGV15sZ 它不会递归工作,但这对我来说并不重要。