【发布时间】:2012-08-25 04:06:15
【问题描述】:
我有一个输入 txt 文件,其中包含记录形式的数据(每一行都是一条记录,或多或少像一个 DB 表),我需要查找重复值。例如:
Rec1: ACCOUNT_NBR_1*NAME_1*VALUE_1
Rec2: ACCOUNT_NBR_2*NAME_2*VALUE_2
Rec3: ACCOUNT_NBR_1*NAME_3*VALUE_3
在上述集合中,Rec1 和 Rec2 被认为是重复的,因为 ACCOUNT NUMBERS 相同(ACCOUNT_NBR1)。
注意:上面显示的输入文件是一个分隔符类型的文件(分隔符为 *),但是文件类型也可以是一个固定长度的文件,其中每一列都以指定的位置开始和结束。
我目前正在使用以下逻辑进行此操作:
Loop thru each ACCOUNT NUMBER
Loop thru each line of the txt file and record and check if this is repeated.
If repeated record the same in a hashtable.
End
End
我正在使用“Pattern”和“BufferedReader”java API 来执行上述任务。
但是由于需要很长时间,我想知道更好的处理方法。
谢谢, 涩
【问题讨论】: