【问题标题】:DataLake Power BI Design PatternDataLake Power BI 设计模式
【发布时间】:2020-12-01 07:22:54
【问题描述】:

我们的客户存在一个常见问题,即许多分布式数据存储具有不同的技术堆栈。最后的游戏是通过 Microsoft Power BI 将数据的某些部分组合在一起以生成详细的报告。

这种方法有标准模式吗?我最初的想法是

  1. 在可能的情况下,Azure 数据工厂将数据迁移到 Azure Data Lake。
  2. 如果无法做到这一点,请自动将数据提取并转储到 Azure Data Lake。
  3. 用户 Power BI Desktop 连接到 csv 数据集以生成模型和报告(同时执行大量转换)
  4. 发布到 PowerBI 服务以在用户之间共享

担忧...

  1. 我们应该使用数据工厂(或其他一些 ETL)中的数据流进行转换还是继续使用 PowerBI 中的查询编辑器
  2. 在 PowerBI Desktop 中连接多个数据集和执行大量转换活动是否存在性能问题?
  3. 为了使用新数据更新报表,是否只是覆盖数据湖中之前的 CSV 文件并刷新报表的情况?

【问题讨论】:

    标签: azure powerbi azure-data-factory-2 azure-data-lake-gen2


    【解决方案1】:

    根据我的经验:

    1. 使用查询编辑器。那是流行的工具。随处可见大量示例和视频。
    2. 不确定什么是“多”,但您可以加载最大为 1GB 的电子表格文件。单个工作表最大可达 30MB。 Click here for more on limits
    3. 是的。您还可以设置自动刷新,因此您无需点击任何内容。

    【讨论】:

      猜你喜欢
      • 2020-06-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-11-20
      • 2022-12-05
      • 2022-08-13
      相关资源
      最近更新 更多