【发布时间】:2011-08-23 08:57:00
【问题描述】:
在我的软件中,我需要将字符串拆分为单词。我目前有超过 19,000,000 个文档,每个文档超过 30 个单词。
以下两种方法中哪一种是最好的方法(就性能而言)?
StringTokenizer sTokenize = new StringTokenizer(s," ");
while (sTokenize.hasMoreTokens()) {
或
String[] splitS = s.split(" ");
for(int i =0; i < splitS.length; i++)
【问题讨论】:
-
我估计是第一个,但你为什么不直接测量呢?
-
我可以,但我也对解释感兴趣......
-
如果有人说选项 X 最快怎么办?你会选择那个选项,或者只是为了确定,你会测试两者吗?如果是后者,为什么不立即这样做呢? :)
-
@John :请明确您的问题,您是否需要在 Tokenize 与 split 之间做得更好,或者您正在寻找最好的方法,而不是 Tokenize 与 split
-
@Damodar“在性能方面做到这一点的最佳方式”
标签: java performance stringtokenizer