【问题标题】:Data Lineage in purview insufficient权限范围内的数据沿袭不足
【发布时间】:2021-07-01 05:48:39
【问题描述】:

Azure Purview 目前仅显示来自 ADF 的复制活动的数据沿袭。这足够了吗? 在这个article 中给出:“通过将元数据从 Azure 数据工厂推送到 Azure Purview,可以启用可靠且透明的沿袭跟踪。”这是否超出了复制活动?如果是,我们怎样才能做到这一点?

在 Azure 中还有其他方法可以查看完整的数据沿袭吗?假设我们正在使用 ADF/Synapse/Azure Databricks。

【问题讨论】:

    标签: azure-synapse azure-purview data-lineage


    【解决方案1】:

    Data Factory、Data Share、Synapse、Azure Databricks 等工具都属于数据系统的范畴。当前与 Purview for lineage 集成的数据处理系统列表见此处Azure Purview Data Catalog lineage user guide

    当前 Azure 数据工厂,支持范围:Copy activityData flow activityExecute SSIS package activity 并且数据工厂和 Purview 之间的集成仅支持数据工厂支持的数据系统的子集,如 here 所述。

    Azure Purview 当前不支持用于沿袭或扫描的查询或存储过程。 Lineage 仅限于表和视图源。

    在沿袭视图中查找信息的其他一些方法包括:

    • Lineage 选项卡中,将鼠标悬停在形状上可在工具提示中预览有关资产的其他信息。
    • 选择节点或边以查看其所属的资产类型或切换资产。
    • 数据集的列显示在 Lineage 选项卡的左侧。有关列级沿袭的更多信息,请参阅Dataset column lineage

    还通过 Atlas 挂钩和 REST API 支持自定义血统报告。数据集成和 ETL 工具可以在执行时将沿袭推送到 Azure Purview。

    将 Azure Purview 帐户连接到 Synapse 工作区可让您发现 Azure Purview 资产并通过 Synapse 功能与它们进行交互。

    以下是 Synapse 中可用的 Azure Purview 功能列表:

    • 使用顶部的搜索框根据关键字查找 Purview 资产
    • 了解基于元数据、沿袭、注释的数据
    • 使用链接服务或集成数据集将这些数据连接到您的工作区
    • 使用 Synapse Apache Spark、Synapse SQL 和 Data Flow 分析这些数据集
    • 元数据概览、查看和编辑元数据架构以及分类、词汇表术语、数据类型和描述
    • 查看lineage以了解依赖关系并进行影响分析。
    • 查看和编辑联系人以了解谁是数据集的所有者或专家
    • 相关以了解特定数据集的层次依赖关系。这种体验有助于浏览数据层次结构。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-11-29
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-07-06
      相关资源
      最近更新 更多