【问题标题】:How is the DOM parsed? [duplicate]DOM是如何解析的? [复制]
【发布时间】:2011-06-06 00:02:30
【问题描述】:

可能重复:
If you're not supposed to use Regular Expressions to parse HTML, then how are HTML parsers written?

我的问题很简单:当前的 DOM 解析器实际上如何从字符串(XML、HTML 或其他)解析 DOM?

我知道you shouldn't parse html with RegEx,但是 DOM 解析器不能使用 RegEx 来匹配打开/关闭标签的模式吗?或者,是否有一个很好的一次性算法将提供的字符串解析为字符数组?

【问题讨论】:

  • 取决于解析器的实现不是吗?
  • 但是要快速回答这个确切的问题:最可能使用正则表达式 - 但仅用于标记化(例如识别开始和结束标签)。
  • 不知何故我错过了这个问题,我投票决定关闭这个副本。

标签: html xml dom domparser


【解决方案1】:
【解决方案2】:

好吧,您可以从以下基本方法开始:

http://www.blackbeltcoder.com/Articles/strings/parsing-html-tags-in-c

然后将其展开以将所有内容存储到完整的 DOM 树结构中。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-06-30
    • 2013-09-07
    • 2013-01-31
    • 2015-07-10
    • 2014-10-14
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多