【问题标题】:Druid's data sources columns visible in Superset as STRINGDruid 的数据源列在 Superset 中显示为 STRING
【发布时间】:2019-10-24 15:23:57
【问题描述】:

我已经用平静的方式向德鲁伊注入了数据。 数据源通过霸王控制台可见,都可以查询到。

  • 宁静 0.1.0
  • 德鲁伊 12.3
  • 超集 0.1.0

当我将 Druid 的数据源附加到 Superset 时,我看到所有定义的列都是字符串类型。这很奇怪,因为我在宁静模式中定义了如下类型:

"dimensionsSpec": {
  "dimensions": [
   "some_id",    
   {
     "type": "double",
     "name": "total_positions"
   }]
}

我尝试使用计算列和指标,但是当我保存这些新元素时,这些新元素没有出现在 Druid 中。 Druid chart -> datasource editor

有人遇到过类似的问题吗?有什么方法可以更改 Superset 中的列类型,或者应该以不同的方式定义模式。 非常感谢。

【问题讨论】:

    标签: druid superset


    【解决方案1】:

    我们的环境也有同样的问题。我们计划在 Apache Branch Report 中使用它。

    作为一种解决方法,我们在 Hive 上为 Druid 创建了外部表,并在 Superset 中使用 Hive 连接器以便在 SQL 实验室中转换为整数:https://cwiki.apache.org/confluence/display/Hive/Druid+Integration

    但是,如果 Superset 图表能够解释开箱即用的数字维度,那么架构会更精简。

    【讨论】:

    • Apache 分支报告?这个已经发布了吗? SQL Lab 唯一的问题是缺乏文档,很难用它做一些自定义的事情
    • 完全同意!超集绝对应该支持数字维度。
    【解决方案2】:

    我们遇到了类似的问题。默认情况下,所有维度都被视为字符串。在 Tranquility 中,我们使用了 metrixSpec 并将列定义为 longSum。这些列将反映为 Superset 中的数字。记得刷新 Superset 中的 Druid 元数据。

    "metricsSpec": [
            {
              "name": "trafficUp",
              "type": "longSum",
              "fieldName": "trafficUp"
            }
    ]
    

    【讨论】:

      猜你喜欢
      • 2019-10-19
      • 2018-10-15
      • 2018-08-01
      • 2021-12-28
      • 2020-04-09
      • 2022-01-17
      • 2020-04-14
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多