【问题标题】:Best Practise in using OLEDB Source in SSIS在 SSIS 中使用 OLE DB 源的最佳实践
【发布时间】:2021-10-29 21:47:34
【问题描述】:

我是 SSIS 的新手,我想知道在制作新表时什么是最佳做法。 我想根据同一个数据库中的其他四个表创建一个表。但是,我想知道这样做是否更聪明:

  1. 仅使用一个 OLEDB 源并在其中编写 SQL 代码。 或
  2. 使用 4 个 OLEDB 源并将它们排序并连接在一起以创建新表。

目标是在我们的 ETL 中获取新表;新表将使用每个源表中的 2 或 3 列。

【问题讨论】:

  • 请编辑问题以将其限制为具有足够详细信息的特定问题,以确定适当的答案。

标签: sql-server ssis etl oledb sql-server-data-tools


【解决方案1】:

将一个 OLEDB 源与在 SQL 查询中完成的连接一起使用将提供更好的性能。这将让 SQL Server 查询优化器确定加载数据的最有效方式,这是它非常擅长的。它还可以让您识别查询计划中缺少索引等瓶颈。

使用四个不同的 OLEDB 源然后加入 SSIS 有几个可能的缺点:

  • 要使 SSIS 连接正常工作,需要在查询中或使用 SSIS 排序转换对数据进行排序。这为处理增加了一个额外的步骤,根据我的经验,SSIS 排序表现不佳。
  • 您可能会将多余的行加载到 SSIS 中,这些行将被连接逻辑丢弃,除非每一行在每个表中都匹配。这会浪费服务器和网络上的资源。
  • 我敢打赌,四个来源的 SSIS 连接/查询验证步骤将比具有更复杂查询的单个来源花费更长的时间。

【讨论】:

    猜你喜欢
    • 2016-11-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多