【问题标题】:Load all dataset to Data Flow (ADF)将所有数据集加载到数据流 (ADF)
【发布时间】:2021-05-01 15:38:24
【问题描述】:

我想加载所有数据,因为我想将商店列与销售额相结合。数据集很大,无论我如何调整调试设置,都只加载了部分数据。如果我将限制设置得太高(例如:100000000000),我将收到一条指示内部错误的错误消息。结果,我无法精确地旋转表格。

感谢任何见解和 cmets 帮助我指出如何将整个数据加载到数据流中。谢谢

【问题讨论】:

    标签: azure-data-factory-2 azure-data-flow


    【解决方案1】:

    数据流数据预览主要用于查看数据样本,而不是查看整个数据集。查看整个数据集结果的最佳方法是从调试管道执行数据流并查看输出结果。

    话虽如此...无论您是在数据流画布内使用数据预览,还是使用管道调试会话,当您需要测试大数据量时,都应该使用更大的 Azure IR。

    使用 ADF 开箱即用配置的默认 Azure IR 仅在单个工作程序节点上提供 4 个内核,因为它旨在提供采样数据的调试和预览。

    使用通用或内存优化和最少 32 个工作核心创建一个新的 Azure IR,然后使用这个更大的计算大小重新启动调试会话。

    【讨论】:

    • 感谢您的推荐。最后,我们在将数据存储到 ADF 之前减小数据大小。
    猜你喜欢
    • 2017-06-05
    • 1970-01-01
    • 1970-01-01
    • 2020-10-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-08-31
    • 2016-04-26
    相关资源
    最近更新 更多