【发布时间】:2010-12-20 19:15:50
【问题描述】:
我试过用这个但是没用-
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
【问题讨论】:
-
伙计们,你忘了还有拉丁字母以外的字母。
-
但是如果你想验证一个主机名,最好排除无效的字母。
标签: java regex non-alphanumeric
我试过用这个但是没用-
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
【问题讨论】:
标签: java regex non-alphanumeric
使用[^A-Za-z0-9]。
注意:删除空格,因为它通常不被视为字母数字。
【讨论】:
试试
return value.replaceAll("[^A-Za-z0-9]", "");
或
return value.replaceAll("[\\W]|_", "");
【讨论】:
return value.replaceAll("\\W", "");
您应该知道[^a-zA-Z] 将替换字符范围 A-Z/a-z 中不属于自身的字符。这意味着é、ß 等特殊字符或西里尔字符等将被删除。
如果不想替换这些字符,请改用预定义的字符类:
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS:\p{Alnum} 没有达到这个效果,它的作用和[A-Za-z0-9] 一样。
【讨论】:
[^\\p{IsAlphabetic}\\p{IsDigit}] 效果很好。
{IsDigit} 对我不起作用而 {Digit} 起作用的原因是我正在 Android 上尝试这个。 Android 默认开启了UNICODE_CHARACTER_CLASS。感谢您的许可。
return value.replaceAll("[^A-Za-z0-9 ]", "");
这将保留个空格。我想这就是你想要的。否则,从正则表达式中删除空格。
【讨论】:
你也可以试试这个更简单的正则表达式:
str = str.replaceAll("\\P{Alnum}", "");
【讨论】:
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}。
Java 的正则表达式不需要您在正则表达式周围放置正斜杠 (/) 或任何其他分隔符,这与 Perl 等其他语言不同。
【讨论】:
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]当插入符号^作为方括号内的第一个字符出现时,它否定了该模式。此模式匹配除 a 或 b 或 c 之外的任何字符。
将关键字视为两个功能:
[(Pattern)] = match(Pattern)[^(Pattern)] = notMatch(Pattern)另外关于模式:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
因此它将替换所有未包含在模式中的字符
【讨论】:
我用这个方法来创建文件名:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
【讨论】:
如果您还想允许不属于 ascii 字符集的字母数字字符,例如德语变音符号,您可以考虑使用以下解决方案:
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
请注意,使用 UNICODE_CHARACTER_CLASS 标志可能会对性能造成影响(请参阅此标志的 javadoc)
【讨论】:
使用 Guava,您可以轻松组合不同类型的标准。对于您的具体解决方案,您可以使用:
value = CharMatcher.inRange('0', '9')
.or(CharMatcher.inRange('a', 'z')
.or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)
【讨论】:
简单方法:
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
【讨论】:
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
输出:衣原体IgGIgMIgAAbs8006
Github:https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
【讨论】:
Guava 的CharMatcher 提供了简洁的解决方案:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);
【讨论】: