python帮助显示正则表达式结果答案

【问题标题】：python help display regular expression resultpython帮助显示正则表达式结果
【发布时间】：2009-12-02 23:32:39
【问题描述】：

我在python中做简单的正则表达式

我正在尝试 re.split，但是像 ['\r\n', '\r\n'] 这样的东西来了，而不是答案。有人可以告诉我如何显示实际文本吗？

我试过这个说法：

t_html = re.split("<[a-zA-Z0-9\s\w\W]*>[a-zA-Z0-9\s\w\W]*</[a-zA-Z0-9\s\w\W]*>" ,s)

谢谢

【问题讨论】：

呃，请发布您尝试使用的正则表达式。
我正在尝试获取所有 html 标签及其内容...例如，如果我有这个：“helloasfasdf”它会将其拆分为 hello 和 asfasdf
不要使用正则表达式来解析 html。使用美丽汤 www.crummy.com/software/BeautifulSoup
考虑嵌套标签的真实 html 会发生什么。
一些东西
更多东西
还有更多东西
gnibbler 是对的。使用 Beautiful Soup 解析 HTML。不要重复不要尝试使用正则表达式来解析 HTML。

标签： python regex

【解决方案1】：

如果您想使用正则表达式解析 html，请参阅here。

【讨论】：

【解决方案2】：

re.split 就其本质而言会在模式上拆分，但不会保留它。如果要返回与模式匹配的字符串，可以在模式周围加上括号： re.split((R),string) 其中 R 是您的表达式。如果您想说查找所有不重叠的匹配项，请使用 re.findall 它将返回一个列表。有关更多详细信息和选项，请参阅here。

【讨论】：