【发布时间】:2016-08-22 06:59:10
【问题描述】:
我想使用正则表达式操作解析出 URL 的一部分。这可能是个老问题。但是我是正则表达式的新手,并且搜索了很多我的要求但无法找到它。我知道 ParseURL 可以在这里使用。但是我的 URL 结构不正确,无法使用它。假设我的网址如下,
url = https://www.sitename.com/&q=To+Be+Parsed+out&oq=Dont+Need+to+be+parsed
在这里我想找出 &q= 何时发生并解析直到 & 下一次发生。我想删除中间的 + 或任何特殊字符。输出应该是,
To Be Parsed out
如果不匹配,则应返回原始 URL。
我已经尝试了以下,
re.search('q=?([^&]+)&',url).group(0)
返回,
&q=To+Be+Parsed+out&oq=Dont+Need+to+be+parsed
谁能帮我分析一下。谢谢
【问题讨论】:
标签: python regex python-2.7