【发布时间】:2014-02-11 22:37:23
【问题描述】:
我只设法提取了我使用的网站列表的 TLD
REGEXP_EXTRACT(Domain_name, r'(\.[^.:]*)]\.?:?[0-9]*$') AS web_tld
例子:
我有
www.example1.abc.com
www.example2.efg.123.net
我想要结果
子域
example1
efg
域
abc
123
顶级域名
.com
.net
编辑: 在我的查询中遇到错误 '必须指定一个捕获组' 当我使用 (.?([^.:]+).([^.:]+).([^.:]+):?[0-9]*$) 作为正则表达式时
SELECT
REGEXP_EXTRACT(Domain, r'(\.?([^.:]+)\.([^.:]+)\.([^.:]+):?[0-9]*$)'),
FROM [weblist.domain]
ORDER BY 1
LIMIT 250;
【问题讨论】:
标签: sql regex google-bigquery