【问题标题】:Is there a way to parse XML tags in BigQuery Standard SQL?有没有办法在 BigQuery Standard SQL 中解析 XML 标签?
【发布时间】:2018-02-23 18:25:17
【问题描述】:

我读到它是bad idea to parse XML/HTML using regular expressions。另一种建议是使用 XML 解析器。 BigQuery 标准 SQL 库中是否存在一个?

【问题讨论】:

  • 你可以使用 JavaScript UDF 吗?您可能可以使用 JavaScript 解析 XML。
  • @ElliottBrossard 你能再解释一下吗?如果您认为使用 JavaScript UDF 很有用,您能否发布如何使用它作为答案?谢谢。
  • 谢谢。这很有帮助

标签: sql google-bigquery


【解决方案1】:

这里是有关如何在 BigQuery 中使用 Javascript UDF 的文档,就像 Elliot 提到的那样。

https://cloud.google.com/bigquery/docs/reference/standard-sql/user-defined-functions

我想 UDF 可能看起来像

CREATE TEMPORARY FUNCTION XML(x STRING)
RETURNS STRING
  LANGUAGE js AS """
  var data = fromXML(x);
  return data.title;
"""
OPTIONS(
library="gs://<BUCKET_NAME>/from-xml.min.js"
);
SELECT XML(a) FROM UNNEST(["<title>Title of Page</title>"]) as a

from-xml.min.js 来自this 库并加载到您的 gcs 帐户中

【讨论】:

    猜你喜欢
    • 2022-07-10
    • 2021-10-28
    • 2020-11-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-07-07
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多