【发布时间】:2012-09-08 14:14:19
【问题描述】:
我们正在处理 SQL Server 数据库中的大数据,
现在包执行需要几个小时才能执行。
有什么方法/技术可以优化包的执行时间吗?
我知道SSIS Parallelism。
还有其他最好的方法吗?
编辑:
我们正在处理超过 2 千万条记录。
SQL 服务器数据库是数据源和目标(在同一台服务器中),我使用了诸如派生列、条件拆分、多播、数据转换、查找、OLEDB 命令、OLEDB 目标、OLEDB 源、合并、合并等转换连接、排序、聚合转换。
【问题讨论】:
-
就您的问题而言,它相当模糊,无法回答。 “大数据”对您意味着什么?你的瓶颈是什么?包裹在哪里花费时间?您的数据流是什么样的?您的数据类型是什么?
-
补充比尔的问题...数据源在哪里?目的地在哪里?你正在执行什么样的转换?
标签: sql-server-2008 ssis execution-time