【发布时间】:2018-03-21 14:53:36
【问题描述】:
我正在尝试(未成功)将 Google BigQuery 中的字符串列拆分为包含所有单个单词和所有单词对的行(彼此相邻且按顺序排列)。我还需要维护 IndataTable 中单词的 ID 字段。两个记录集都有 2 列。
IndataTable 作为 IDT
ID WordString
1个苹果香蕉梨
2根胡萝卜
3蓝红绿黄
OutdataTable 作为 ODT
ID WordString
1 个苹果
1根香蕉
1 个梨
1个苹果香蕉
1个香蕉梨
2根胡萝卜
3 蓝色
3红色
3绿色
3 黄色
3蓝红
3红绿
3 绿黄(仅对彼此相邻)
这在 BigQuery SQL 中可行吗?
编辑/添加:
到目前为止,这就是我所拥有的,可以将其拆分为单个单词。我真的很难弄清楚如何将其扩展到单词对。我不知道这是否可以对其进行修改,或者我完全需要一种新方法。
SELECT ID, split(WordString,' ') as Words
FROM (
select *
from
(select ID, WordString from IndataTable)
)
【问题讨论】:
-
您能添加到目前为止您尝试过的代码吗?
-
刚刚添加了适用于单个单词的现有代码。
标签: google-bigquery bigquery-standard-sql legacy-sql