【发布时间】:2017-04-07 22:47:55
【问题描述】:
我可以请求您的帮助,以便使用 REGEXP_EXTRACT 构建用于 Google Big Query 的正则表达式,该表达式将解析由特定键标识的 url 参数的值?
假设我要解析的参数的键值等于“源”。解析应该:
- 确保键前有“?”或“&”,之后有一个“=”:所以在示例中匹配“?source =”或“&source =”
- 捕获值直到第一个“&”或字符串结尾
- 如果上述条件多次匹配,则应采用第一次出现的值
以下是一些所需行为的示例(它们都应提供“google”作为输出):
- www.google.com?source=google&medium=cpc --> 输出:google
- www.google.com?source=google --> 输出:google
- www.google.com?medium=cpc&source=google --> 输出:google
- www.google.com?medium=cpc&source=google&keyword=foo --> 输出:google
- www.google.com?medium=cpc&source=google&keyword=foo&source=bing --> 输出:google
- www.google.it?medium=cpc?source=goo-gle --> 输出:goo-gle
- www.google.it?medium=cpc?source=google?med=cpc&keyword=foo --> 输出:google?med=cpc
非常感谢您的帮助!
【问题讨论】:
标签: regex google-bigquery