【问题标题】:Convert strings to opening and closing tags (XML)将字符串转换为开始和结束标记 (XML)
【发布时间】:2014-04-13 18:21:27
【问题描述】:

我正在尝试将文本文件(来自 Dokuwiki)转换为 XML 以进行进一步处理。为此,我需要将一些特殊的格式字符串转换为开始和结束标签。 例如:标题用“===”("=== Headline of article ===")标记。但我不能简单地将"===" 替换为“<head>”,因为我需要第二个"===" 为“</head>”(结束标记)。我希望你明白我的意思。我必须根据前一个字符串用两个不同的字符串替换相同的字符串。程序应该是用 Python 写的,但我其实只需要算法……

谢谢

【问题讨论】:

  • 让 Dokuwiki 的解析器完成这项工作怎么样?例如,在 python 中,您可以使用 urllib 来检索 xhtml 文档。它符合您的需要吗?
  • 不,它没有。但我自己找到了一个合适的解决方案:pastebin.com/pFGV15sZ 它不会递归工作,但这对我来说并不重要。

标签: xml tags dokuwiki


【解决方案1】:

正则表达式时间: 要替换第一组"===",请使用“^”锚:r/^=== /\<head\>/ 要替换第二个"===",请使用“$”锚:r/ ===$/\<\\head\>/

【讨论】:

  • 去掉前导的“===”后,就不需要特别的方法来选择剩下的了,直接用字符串“===”来匹配就行了。
猜你喜欢
  • 1970-01-01
  • 2011-04-10
  • 1970-01-01
  • 1970-01-01
  • 2023-03-23
  • 1970-01-01
  • 2018-11-14
  • 2020-08-11
  • 1970-01-01
相关资源
最近更新 更多