没有测试就无法判断,内部细节可能会改变一种解决方案对另一种解决方案的作用,因此最好的方法是衡量。众所周知,流有点慢 - 它们背后确实有基础设施......
这是一个天真的简单测试(数据很少):
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@Warmup(iterations = 5, time = 2, timeUnit = TimeUnit.SECONDS)
@Measurement(iterations = 5, time = 2, timeUnit = TimeUnit.SECONDS)
@State(Scope.Benchmark)
public class CSVParsing {
public static void main(String[] args) throws RunnerException {
Options opt = new OptionsBuilder().include(CSVParsing.class.getSimpleName())
.jvmArgs("-ea")
.shouldFailOnError(true)
.build();
new Runner(opt).run();
}
@Param(value = { "a,e, b,c,d",
"a,b,c,d, a,b,c,da,b,c,da,b,c,da,b,c,da,b,c,da,b,c,da,b,c,da,b,c,d, e",
"r, m, n, t,r, m, n, tr, m, n, tr, m, n, tr, m, n, tr, m, n, tr, m, n, tr, m, n, t, e" })
String csv;
@Fork(1)
@Benchmark
public boolean containsSimple() {
return Arrays.asList(csv.split(",")).contains("e");
}
@Fork(1)
@Benchmark
public boolean containsStream() {
return Arrays.asList(csv.split(",")).stream().filter(e -> e.equals("e")).findFirst().isPresent();
}
@Fork(1)
@Benchmark
public boolean containsStreamParallel() {
return Arrays.asList(csv.split(",")).stream().filter(e -> e.equals("e")).findFirst().isPresent();
}
}
即使您不理解代码,结果也是可以比较的简单数字:
CSVParsing.containsSimple (first Parameter) 181.201 ± 5.390
CSVParsing.containsStream 255.851 ± 5.598
CSVParsing.containsStreamParallel 295.296 ± 57.800
我不会显示其余的结果(对于其他参数),因为它们在同一范围内。
底线是它们确实不同,最多 100 ns;让我重申一下:纳秒。
确实有区别;但是如果你真的很关心这个差异,那么 csv 解析可能首先是错误的选择。