【发布时间】:2009-04-07 08:50:59
【问题描述】:
我正在执行从一个系统到另一个系统的一次性导入例程。第一步是从大量 csv 文件中导入大量数据。每个 csv 文件中的第一行是字段名制表符分隔。其余的是数据,也是制表符分隔,行用 CR 分隔。
我编写了一个 20 行的例程,用于创建表并将数据读入 sql 数据库。我将所有仅包含数字数据且字段名称中包含“ID”的字段设置为 INT,其余字段设置为 NVARCHAR (255)。
现在我想对其进行改进,使其查看数据并尝试找出每列中包含的数据类型。有时间、日期、id 字段、文本字段和数字字段。
我知道怎么做,这很容易,但我想知道这方面是否有一些工作,以及是否有一些类可以处理这个问题。
找出首选尺寸更难。我认为我必须 1. 浏览所有行并找出每列最长的数据。 2. 有一个查找表,我将例如长度 0-50 映射为 100,长度 51-255 映射为 255 等等。
有人对此有一些聪明的意见吗?正如我所说的,这并不是什么特别难做的事情,但如果能制作一个智能库,以便以后在其他导入场景中使用,那就太好了。
【问题讨论】: