【发布时间】:2020-03-30 10:00:05
【问题描述】:
我有一个如下所示的 URL:
url = https://www.sx.com/found/text.html
我想用捕获组替换第三个和第四个斜杠之间的文本,即我想用一个新的字符串(新闻)替换“找到”,如下所示:
replace = re.sub(r'(?:/.*/)(.*)/', r'/news/\1', url)
想要的结果:
replace = https://www.sx.com/news/text.html
但是我得到了这个结果:
https:/news/text.html
我在这里做错了什么?
【问题讨论】:
-
使用
re.sub(r'^(https?://[^/]*/)[^/]+/', r'\1news/', url)(demo)