【发布时间】:2019-09-29 10:18:14
【问题描述】:
我希望在 HTML 文档中替换以下输入和所需输出,可能使用正则表达式或字符串替换。
if :
input: '<b>º </b>'
output: ['º']
input: '<b>Nº </b>'
output: []
input: '<b>1º </b>'
output: []
input: '<b>1ª </b>'
output: []
input: '<p>N<u>º </u></p>'
output: ['º']
尝试
l = [ ('<b>º </b>', ['º']), ('<b>Nº </b>', [])]
result = None
for i in l:
codigo = re.sub(r'<(b|sup|s|u)>\s*[oº]\s*</(b|sup|s|u)>', 'º ', i[0], re.I)
soup = BeautifulSoup(codigo, 'html.parser')
result = soup.find_all('b', string='º')
assert str(result) == l[1], "ops.."
我该如何解决这个问题?
【问题讨论】:
-
您可以将其发布到 StackOverflow 的葡萄牙语版本:pt.stackoverflow.com
-
我投票结束这个问题,因为它属于pt.stackoverflow.com
-
对不起。非常抱歉。
-
@Emma,我用其他示例完成了输入和所需输出。更好吗?
标签: python arrays regex python-3.x beautifulsoup