【发布时间】:2011-04-29 04:36:25
【问题描述】:
我需要替换部分字符串。我正在查看 Python 文档并找到了 re.sub。
import re
s = '<textarea id="Foo"></textarea>'
output = re.sub(r'<textarea.*>(.*)</textarea>', 'Bar', s)
print output
>>>'Bar'
我希望这会打印 '<textarea id="Foo">Bar</textarea>' 而不是“bar”。
谁能告诉我我做错了什么?
【问题讨论】:
-
通常的建议是不要对 HTML 使用正则表达式。这是这个网站上的一个长期回应,有一些经典的回应,最终成为这个。 stackoverflow.com/questions/1732348/…
-
是的,考虑使用正则表达式,因为它真的很小,但改用 BeautifulSoup。