【发布时间】:2012-03-10 11:24:01
【问题描述】:
我在 Stack Overflow 上一遍又一遍地看到,正则表达式不适合 XHTML。然而,我没有看到的是另一种选择。
大多数文本编辑器都有内置的 RegEx 搜索和替换功能,非常易于使用。好吧,除了它不适用于 HTML 的事实。是否有一些工具或语言用于解析 和 替换 XHTML?如果你能说“找到所有具有“引用”类的段落标签,这些标签在“猴子”类的 DIV 中,然后在里面添加一个带有“猴子引用”的 H2 标签,那就太好了。
另一个我正在努力寻找解决方案的示例是在段落标签中查找所有单词并在它们周围包裹一个 SPAN 标签(用于逐字突出显示音频)。那种东西。
是否有适合此类事情的工具或语言?
【问题讨论】:
-
在您的“在每个单词周围包装
<span>”示例中,最好在 JavaScript 中动态执行此操作。保持标记干净。 -
没有人推荐过 JavaScript?
-
是的,它被称为 HTML/XML 解析器。其中有很多,具体取决于您使用的语言/平台。在 SO 中搜索
LanguageX HTML parser,例如stackoverflow.com/questions/3577641/… -
@minitech 这是个好主意。唯一的问题是
<span>获得了一个唯一的 ID,该 ID 对应于一个并不总是系统的标签。所以它最终是<span id="word013a">,下一个可能是<span id="word013b">或可能是<span id="word014">。但出于这个原因,我会考虑使其系统化。 -
@Qtax 谢谢。这些解析器似乎没有内置任何替换功能,但我想这就是您使用该语言的目的。我希望有一些非常简单的东西,专门用于本地查找/替换操作。 JavaScript 对我的示例有意义,但大多数时候我只想调整 50 个左右结构相似的 XHTML 文件。
标签: html regex xhtml html-parsing