【发布时间】:2017-11-30 08:39:16
【问题描述】:
我有大约 30000 个包含销售数据的 Excel 文件,但架构不同(一个有一个名为 “产品名称” 的列,另一个只有 “产品”)但是包含有关来自不同商店的销售的相同信息。这些文件是由某些人手动生成的,因此也可能出现拼写错误。有没有什么好的方法可以导入这些数据,或者我必须在 SSIS 中创建 300 个 ETL 包?
【问题讨论】:
-
那么,列数和列的顺序会一样吗?
-
从战略上讲,我会 1) 扫描所有文件并将所有列名提取到表中 2) 为源 col name target (=schema) col name 构建字典 3) 使用 col 导入所有文件名称翻译表
-
@JayasuryaSatheesh 不。问题是文件可以有完全不同的模式,一个商店可以在一个文件中发送销售和采购,不同的工作表和另一个可以在 2 个文件中发送。
-
Mikolaj 看看我对这个话题的回答stackoverflow.com/questions/47437513/…
-
@KeithL 我就是那个初级的人:D
标签: sql sql-server excel ssis etl