【问题标题】:regex extract code from <body>...</body>?正则表达式从 <body>...</body> 中提取代码?
【发布时间】:2014-03-22 04:51:45
【问题描述】:

如何以正则表达式格式捕获 html .... 中的所有代码?目前我尝试了几个代码,但没有全部捕获,我尝试了这个

<body>([^*]*)<\/body>

但它没有捕获所有代码,因为一些 javascript 代码正在影响正则表达式命令。

您知道解决此问题的任何链接或示例吗?

TIA

【问题讨论】:

标签: regex html-parsing regex-lookarounds


【解决方案1】:

这可能会捕获标准 &lt;body&gt; 标记之间的任何内容

(?:<body>((?s).*)<\/body>)

示例:http://regex101.com/r/iS4eE3

【讨论】:

  • 如果&lt;body anything="yes"就不行
  • @MuhammadSanaullah 当然不是,为什么会这样?
  • 我不是为你评论的,我是为那些不熟悉正则表达式的人评论的,他们会使用这个正则表达式代码并想知道为什么它不起作用。
【解决方案2】:

使用这个正则表达式

'#<body>(.*?)<\/body>#s'

【讨论】:

    猜你喜欢
    • 2018-11-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-11-11
    • 1970-01-01
    • 2023-03-18
    • 2012-10-21
    相关资源
    最近更新 更多