【发布时间】:2014-01-17 10:50:52
【问题描述】:
我正在导入一个包含 3 列的 CSV,其中一列可能有重复记录。
我有两件事要检查:
1. The field 'NAME' is not null and is a string
2. The field 'ID' is unique
到目前为止,我正在解析 CSV 文件一次并检查 1. (NAME is valid),如果它失败,它会简单地跳出 while 循环并停止。
我想问题是,我如何检查 ID 是否唯一?
我有如下字段:
NAME, ID,
Bob, 1,
Tom, 2,
James, 1,
Terry, 3,
Joe, 4,
这将输出类似于“第 3 行重复 ID”的内容
谢谢
P.S 这个 CSV 文件有更多的列,可以有大约 100,000 条记录。我出于特定原因对其进行了简化以解决重复的列/字段
谢谢
【问题讨论】:
-
你要插入数据库吗?
-
如何将每个值推入数组并检查每一行
ID值是否不在此数组中?如果是的话,就echo "error on line xxx"; -
如果您在编码站点检查此内容,则可能会出现性能问题。我认为,更好的方法是检查数据输入级别并构建 CSV 状态。如果不关心性能问题,您可以在程序端检查您的 ID 是否已存在于您的数据库或存储位置。