【发布时间】:2012-07-12 15:04:12
【问题描述】:
我正在设计一个数据仓库系统,原始数据源有两个:文件(十六进制格式,记录结构已知)和PostgreSQL数据库。 ETL 阶段必须读取两个源(文件和数据库)的内容并组合/集成/清理它们。之后,将数据加载到 DW 中。
为此,工具(例如 Talend)或 ad-hoc 解决方案(使用编程语言编写 ad-hoc 例程)更好吗?
【问题讨论】:
标签: postgresql etl data-warehouse data-cleaning