【发布时间】:2017-07-13 07:09:23
【问题描述】:
我有一个本地 SAP 数据库,我想每天将其中的一些数据(SAP 数据库中的一些表)推送到 Azure。将使用合并策略上传数据(如果检测到更改则更新,如果记录丢失则删除,否则插入)。我正在考虑使用以下设置来做到这一点:
- Install on premise integration Services (SSIS). The client already has license for this.
- Install SAP connector on premise.
- Pull data from SAP into text files (on premise, into multiple CSV files) (create ETL's for this).
- Push those files into a Blob Storage (via AzCopy), so I create a job or process somehow locally that will handle newly created files.
- Load data into Data Warehouse using PolyBase (https://docs.microsoft.com/en-us/azure/sql-data-warehouse/sql-data-warehouse-get-started-load-with-polybase) using an UP-SERT strategy.
这肯定会起作用,但我想知道是否可以使用 ETL(使用 SSIS 包)直接上传该数据,基本上跳过这些步骤:
- 将纯文件保存到本地磁盘。
- 将它们推送到 Azure Blob 存储。
- 在上传的文件上使用虚拟表从文件中加载数据。
我的担忧在于: - 表现 - 费用
你认为最好的方法是什么?
谢谢!
【问题讨论】:
标签: performance azure ssis azure-sql-database data-warehouse