本文章将介绍如何创建kylin的cube,首先准备hive的表及数据。在创建cube之前先介绍下kylin的几个概念:project、model、cube,刚开始接触的时候,这些概念很容易弄混。

1. project,项目名称,经常以hive的数据库的名字命名,下面可以有很多model。
2. model,hive数据库下某些表之间的关联关系,即数据模型,也可以是这个数据库下所有表之间的关联关系。
3. cube,在model的基础上做最大化的预计算,并把预计算的结果存放于hbase,此为cube。每个model对应一个cube。
4. Dimensions,维度,可以自行选择每个表的维度,可以认为就是关联后整个大表的字段吧
5. Measures,根据维度的不同,可以采用不同的度量计算:SUM、MAX、MIN、COUNT和COUNT_DISTINCT等

一、建project

kylin的使用 -- 创建cube

点击“+”按钮,输入project名称即可。这里新建的project 叫 jira2

二、加载数据源表

建model之前需要为project引入数据源

选择项目  -->  model --> data source  -->  加载数据

kylin的使用 -- 创建cube

可以手动输入,也可以从kylin自动识别到的hive表中点击选择

kylin的使用 -- 创建cube

三、建model

models --> new --> new model   --> 输入model name-->  选择事实表  -->  增加维度表 

kylin的使用 -- 创建cube

选择维度列

kylin的使用 -- 创建cube


后面的measures、settings默认即可

最后点击保存


四、创建cube模型

kylin的使用 -- 创建cube

选择维度

kylin的使用 -- 创建cube

这里我选择了所有的维度表的维度。

选择度量,选择了事实表的ID用来计算count_distinct

kylin的使用 -- 创建cube

后面一些设置根据自己情况而定,我都保持默认。


五、cube生成

kylin的使用 -- 创建cube

点击build后即可将cube的预计算结果保存在hbase

kylin的使用 -- 创建cube

查看监控创建完成

接下来就可以做查询了。。。。


相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-12-14
  • 2018-08-15
  • 2021-09-28
  • 2022-12-23
  • 2021-09-09
  • 2021-11-13
猜你喜欢
  • 2021-07-19
  • 2021-10-13
  • 2021-08-10
  • 2021-12-22
  • 2021-08-10
  • 2021-05-30
  • 2021-06-02
相关资源
相似解决方案