【问题标题】:Understanding query with REGEX expressions使用 REGEX 表达式了解查询
【发布时间】:2018-02-22 19:30:22
【问题描述】:

因此,我正在查看一位已经离开一段时间的前雇员留下的东西的文档。我了解正则表达式,我只是不知道在这种情况下发生了什么。

TABLE_QUERY(server_logs_abc, 'REGEXP_MATCH(table_id, r"^def_[A-Za-z0-9]{5}_[\d]{8}") and datediff( current_timestamp(), timestamp( regexp_extract(table_id,r"(\d{8})$") ) ) < 30')

也有这样的日常表

iserver_cogs_abc.def_4J389_20180221
iserver_cogs_abc.def_4J389_20180220
iserver_cogs_abc.def_4J389_20180219
iserver_cogs_abc.def_4J389_20180218

以此类推。

所以我理解这两个正则表达式。 REGEXP_MATCH 的第一个是命名约定:

def_4J389_2018XXXX

(XXXX 代表月份和日期时间码,即 0221)

REGEXP_EXTRACT 中的第二个 Regex 是 8 位时间码(即 20180221

但这一切放在一起意味着什么。此外,前导 r 意味着进行两个正则表达式部分(即 r"^def_[A-Za-z0-9]{5}_[\d]{8}"

【问题讨论】:

    标签: sql regex google-bigquery


    【解决方案1】:

    第二个正则表达式提取表名的 YYYYMMDD 部分,然后将其转换为时间戳,最后与当前时间戳进行比较,DATEDIFF 然后返回这两个时间戳之间的天数

    因此,它们一起返回仅返回与第一个正则表达式匹配的模式的最近 30 天表

    截至r - 当用作字符串的前缀时 - 它使其成为在正则表达式中广泛使用的所谓原始字符串。例如 - 您可以使用两个反斜杠转义“\”、“_”或“%”。例如, ”\%”。如果您使用的是原始字符串,则只需要一个反斜杠。例如,r"\%" 我建议您谷歌搜索原始/文字字符串以获取更多详细信息

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-12-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多