【发布时间】:2014-09-02 02:56:40
【问题描述】:
我是数据库和编程的新手,现在应该创建一个可以存储大量数据的数据库。对我来说关键问题是我需要每天更新数据库并将 150 组数据添加到 60 个不同的表中。数据集都采用不同的格式(.csv、.row、.sta...)。
我希望能够创建一个可以每天自动导入数据集并更新表格的 GUI。到目前为止,我发现了很多关于从数据库导出数据的信息,但关于导入数据的信息却不多。
有人有指针吗?
【问题讨论】:
我是数据库和编程的新手,现在应该创建一个可以存储大量数据的数据库。对我来说关键问题是我需要每天更新数据库并将 150 组数据添加到 60 个不同的表中。数据集都采用不同的格式(.csv、.row、.sta...)。
我希望能够创建一个可以每天自动导入数据集并更新表格的 GUI。到目前为止,我发现了很多关于从数据库导出数据的信息,但关于导入数据的信息却不多。
有人有指针吗?
【问题讨论】:
您没有给出“最佳”的合理定义,您的标准是什么?成本是否是一个主要问题(如果您正在考虑使用 Matlab,我猜不是,但也许)? UI 是专为您设计的,还是让最终用户对它松懈?如果是最终用户,他们有多聪明/可靠?当您说手动导入时,您是指您偶尔手动启动的大部分自动过程,还是它必须提出很多问题并有许多不同的组合?
我每天从不同来源导入大量数据,我必须手动重新启动流程,因为用户进行了更改并需要立即看到它的反映,但我定义的来源集不会经常更改.我在 Microsoft 的 SQL Server 中使用 SSIS(SQL Server 集成服务)工具时运气不错。它当然可以处理大量数据。
基本功能是您编写一个“包”,其中包含您的源是什么、如何配置的定义(即,如果您从文本文件导入,请告诉它名称和路径,它是固定字段还是分隔符,什么是每个字段的分隔符或宽度、要跳过的字段、要跳过的行数等)以及放置位置(数据库名称和表、映射字段等)。然后我在 SQL 代理中设置时间表(我的都是一夜之间),从那里开始都是自动的,除非有什么变化,在这种情况下你编辑你的包来解释变化。
我也可以在任何时候手动启动任何包,而且非常轻松。
而且进口来源的范围令人印象深刻。我从 CSV 文件、Lotus Notes 和 DB2 中提取数据,每晚都是自动的。它也是一个相当图形化的“构建器”,这对于铁杆编码员来说是令人沮丧的,但如果您是编程新手,它可能比更面向代码或脚本的方法更容易。
祝你好运,欢迎来到黑暗面。我们有 cookie。
【讨论】: