【问题标题】:tabular data model in data store lake for power BIPower BI 的数据存储湖中的表格数据模型
【发布时间】:2017-12-21 04:04:36
【问题描述】:

我需要使用数据湖存储中的数据并在 Power BI 中显示。数据量很大,可能是 20 GB 或 50 GB,我不知道功能中会出现什么大小。我也无法使用 Azure DW 和 Azure 分析服务。

现在我提出了一个解决方案,我应该在 azure 数据湖存储中创建一个表格文件(数据透视表),其中包含所有表连接的数据,如存储

地理名称 产品名称 Salesyerar2015 Salesyerar2017 userId

我需要在 Power BI 报告中显示两年的数据。

对于月份级别,我有 24 列用于度量。在电源中,我使用来自数据湖存储的导入数据。

如果数据量更大,我建议使用 Power BI Premium 来获得更大的数据文件,以便它可以容纳在缓存中(50 GB 限制)

现在对于小数据集它工作正常,我无法测试大文件。

现在我想知道何时需要日期级别的表格文件,我如何适应表格模型。

我也想知道这个提议的设计是正确的还是我们有任何其他方法来处理这个用例。

问候, 男子气概

【问题讨论】:

  • 嗨,任何人都可以微软建议我,急需与客户沟通。
  • 大家好,我真的很难理解连接 Power BI 和数据湖存储的最佳方式。我们不能说 Data Lake Store 的大小 = PowerBI 的大小

标签: azure powerbi azure-data-factory azure-data-lake u-sql


【解决方案1】:

我建议您查看 Azure Data Lake Analytics 服务中开箱即用的 U-SQL 采样功能,以将您的数据集减少到 Power BI 可以使用的大小。这是我们经常使用的一种技术。

示例 U-SQL:

@Output =
    SELECT
        *
    FROM 
        @ParsedJSON
    SAMPLE UNIFORM
        (0.04); //4%

然后将文件输出到数据湖存储以供使用。

希望对你有帮助

【讨论】:

  • 非常感谢重播。但我们不会使用数据湖分析来增加成本。还有什么其他选择。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-07-22
  • 1970-01-01
  • 2022-08-16
  • 1970-01-01
  • 2016-06-06
  • 1970-01-01
相关资源
最近更新 更多