【问题标题】:python help display regular expression resultpython帮助显示正则表达式结果
【发布时间】:2009-12-02 23:32:39
【问题描述】:

我在python中做简单的正则表达式

我正在尝试 re.split,但是像 ['\r\n', '\r\n'] 这样的东西来了,而不是答案。 有人可以告诉我如何显示实际文本吗?

我试过这个说法:

t_html = re.split("<[a-zA-Z0-9\s\w\W]*>[a-zA-Z0-9\s\w\W]*</[a-zA-Z0-9\s\w\W]*>" ,s)

谢谢

【问题讨论】:

  • 呃,请发布您尝试使用的正则表达式。
  • 我正在尝试获取所有 html 标签及其内容...例如,如果我有这个:“helloasfasdf”它会将其拆分为 hello 和 asfasdf
  • 不要使用正则表达式来解析 html。使用美丽汤 www.crummy.com/software/BeautifulSoup
  • 考虑嵌套标签的真实 html 会发生什么。
    一些东西
    更多东西
    还有更多东西
  • gnibbler 是对的。使用 Beautiful Soup 解析 HTML。不要重复不要尝试使用正则表达式来解析 HTML。

标签: python regex


【解决方案1】:

如果您想使用正则表达式解析 html,请参阅here

【讨论】:

    【解决方案2】:

    re.split 就其本质而言会在模式上拆分,但不会保留它。如果要返回与模式匹配的字符串,可以在模式周围加上括号: re.split((R),string) 其中 R 是您的表达式。如果您想说查找所有不重叠的匹配项,请使用 re.findall 它将返回一个列表。有关更多详细信息和选项,请参阅here

    【讨论】:

      猜你喜欢
      • 2011-06-18
      • 1970-01-01
      • 1970-01-01
      • 2018-11-05
      • 2023-03-26
      • 2021-08-29
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多