【发布时间】:2015-10-21 20:55:49
【问题描述】:
我想知道在 sqlserver 中导入具有类似数据的 CSV 文件的正确方法是什么
GLMAC1,GLMAC2,GLMAC3,GLYR,GLMON,GLSUB,GLTREF,GLDATE,GLDESC,GLAMT,GLSRC,GLBTCH,GLMCMP
1 ,32 ,110 ,13 ,1 ,0 ,171406200A ,120801 ,MH YM PANT W/DRAWS ,-.15 ,NOIA,ITCGR119,1
1 ,32 ,110 ,13 ,1 ,13402747 ,446286 ,120801 ,URBAN 1714062 ,15.13 ,904 ,ITCGR11B,1
1 ,32 ,110 ,13 ,1 ,0 ,172830300A ,120801 ,OP 5+2 SOCKS ,-.39 ,NOIA,ITCGR165,1
1 ,32 ,110 ,13 ,1 ,13402802 ,338728 ,120801 ,INDUSTRIES 1728303 ,39.28 ,904 ,ITCGR16C,1
1 ,32 ,110 ,13 ,1 ,0 ,171450700A ,120801 ,FA M.3PK FASHION S ,-.08 ,NOIA,ITCGR19Z,1
1 ,32 ,110 ,13 ,1 ,13402845 ,121811 ,120801 ,BO & CO... 1714507 ,7.49 ,904 ,ITCGR1B0,1
这样的行大约有 5000 万行,我想在 SQL Server 中导入这些数据,但我注意到在导入数据后,有些列会转移到另一列,这可能是因为第 9 列可能有一些逗号(,) 值,SQL Server 选择它作为 (,) 分隔符。
有没有一种方法可以在没有错误的情况下在 sql server 中插入数据,或者在插入之前可能会清理 CSV 文件。该文件大小约为 8 GB,我必须使用 010Editor 在编辑器或任何可用的软件中打开文件,这些软件可以帮助我找出第 9 列中包含 (,) 的值,以便我可以手动删除逗号.
【问题讨论】:
标签: csv import etl ssis-2012 data-cleaning