虽然接受的答案很好,但请注意,如果您的输入字符串以空格开头,您最终会得到一个前导的空字符串。例如:
String str = " Hello I'm your String";
String[] splitStr = str.split("\\s+");
结果将是:
splitStr[0] == "";
splitStr[1] == "Hello";
splitStr[2] == "I'm";
splitStr[3] == "Your";
splitStr[4] == "String";
所以你可能想在拆分之前修剪你的字符串:
String str = " Hello I'm your String";
String[] splitStr = str.trim().split("\\s+");
[编辑]
除了 trim 警告之外,您可能还需要考虑 unicode 不间断空格字符 (U+00A0)。这个字符就像字符串中的常规空格一样打印,并且经常潜伏在来自富文本编辑器或网页的复制粘贴文本中。它们不是由.trim() 处理的,它使用c <= ' ' 测试要删除的字符; \s 也不会抓住他们。
相反,您可以使用 \p{Blank},但您还需要启用 unicode 字符支持,而常规 split 不会这样做。例如,这将起作用:Pattern.compile("\\p{Blank}", UNICODE_CHARACTER_CLASS).split(words),但它不会执行 trim 部分。
以下演示了该问题并提供了解决方案。 远依赖正则表达式来解决这个问题,但现在 Java 有 8 位 / 16 位字节表示,一个有效的解决方案变得相当长。
public class SplitStringTest
{
static final Pattern TRIM_UNICODE_PATTERN = Pattern.compile("^\\p{Blank}*(.*)\\p{Blank}$", UNICODE_CHARACTER_CLASS);
static final Pattern SPLIT_SPACE_UNICODE_PATTERN = Pattern.compile("\\p{Blank}", UNICODE_CHARACTER_CLASS);
public static String[] trimSplitUnicodeBySpace(String str)
{
Matcher trimMatcher = TRIM_UNICODE_PATTERN.matcher(str);
boolean ignore = trimMatcher.matches(); // always true but must be called since it does the actual matching/grouping
return SPLIT_SPACE_UNICODE_PATTERN.split(trimMatcher.group(1));
}
@Test
void test()
{
String words = " Hello I'm\u00A0your String\u00A0";
// non-breaking space here --^ and there -----^
String[] split = words.split(" ");
String[] trimAndSplit = words.trim().split(" ");
String[] splitUnicode = SPLIT_SPACE_UNICODE_PATTERN.split(words);
String[] trimAndSplitUnicode = trimSplitUnicodeBySpace(words);
System.out.println("words: [" + words + "]");
System.out.println("split: [" + Arrays.stream(split).collect(Collectors.joining("][")) + "]");
System.out.println("trimAndSplit: [" + Arrays.stream(trimAndSplit).collect(Collectors.joining("][")) + "]");
System.out.println("splitUnicode: [" + Arrays.stream(splitUnicode).collect(Collectors.joining("][")) + "]");
System.out.println("trimAndSplitUnicode: [" + Arrays.stream(trimAndSplitUnicode).collect(Collectors.joining("][")) + "]");
}
}
结果:
words: [ Hello I'm your String ]
split: [][Hello][I'm your][String ]
trimAndSplit: [Hello][I'm your][String ]
splitUnicode: [][Hello][I'm][your][String]
trimAndSplitUnicode: [Hello][I'm][your][String]