【发布时间】:2018-10-23 21:20:14
【问题描述】:
我有一个无标题的纯文本文件(我有字段布局),用逗号分隔,也用引号标识。不幸的是,该文件在记录集中的最后一个字段之后立即包含超过 3000 个空格字符。所有记录都是如此。
示例记录:
"Stuff","Things","No","","000000000.00","000000000.00","" 3000 个空格)
我目前只是尝试通过 SSMS 导入文件向导将数据导入 SQL Server 中的磁盘表,以开始分析数据以确保我的最终表具有相应的类型/大小。预览窗格如下所示:
即使我明确忽略了它要申请的字段,最后一个字段和空白,在最后一个字段上导入失败,声称找不到。
我已经请求了一个更干净的文件,但是我想知道将来在等待更干净的文件时该怎么做。
我对 SSIS 解决方案持开放态度,但是 SSMS 导入解决方案也将不胜感激,因为它只是将数据从诸如此类的文件中获取到临时表中以使用数据。
谢谢
【问题讨论】:
-
为什么不在使用导入向导之前对文件进行预处理以清理它?一个简单的单行
sed命令就可以做到:`s/\s+$\`。 -
这是一个严格的 unix 命令,还是有 cmd 或 powershell 等价的命令?
-
它最初是一个 *nix 命令,但也有为 Windows 编译的版本,例如 GnuWin32 项目。
-
我在此处成功使用了 powershell 脚本:stackoverflow.com/questions/3579157/…。感谢 rd_nielsen 让我到达那里!
标签: sql-server ssis