【发布时间】:2011-05-25 19:02:06
【问题描述】:
我 recently learned 认为,Unicode 在 Java 源代码中不仅可以作为 Unicode 字符(例如 double π = Math.PI; )而且可以作为转义序列(例如 double \u03C0 = Math.PI; )。
第一个变体对我来说很有意义——它允许程序员用他们选择的国际语言命名变量和方法。但是,我没有看到第二种方法的任何实际应用。
这里有几段代码来说明用法,用 Java SE 6 和 NetBeans 6.9.1 测试:
此代码将打印出 3.141592653589793
public static void main(String[] args) {
double π = Math.PI;
System.out.println(\u03C0);
}
说明:π和\u03C0是同一个Unicode字符
这段代码不会打印出任何东西
public static void main(String[] args) {
double π = Math.PI; /\u002A
System.out.println(π);
/* a comment */
}
说明:上面的代码实际上是这样编码的:
public static void main(String[] args) {
double π = Math.PI; /*
System.out.println(π);
/* a comment */
}
哪个cmets out print satement。
仅从我的示例中,我注意到此语言功能存在许多潜在问题。
首先,一个糟糕的程序员可能会用它偷偷地注释掉一些代码,或者创建多种方法来识别同一个变量。也许还有其他我没有想到的可怕的事情可以做。
其次,IDE 之间似乎缺乏支持。 NetBeans 和 Eclipse 都没有为示例提供正确的代码突出显示。事实上,NetBeans 甚至标记了一个语法错误(尽管编译不是问题)。
最后,这个功能的文档记录很差,不被普遍接受。为什么程序员会在他的代码中使用其他程序员无法识别和理解的东西?事实上,我什至在Hidden Java Features question 上都找不到这方面的信息。
我的问题是这样的:
为什么 Java 允许在语法中使用转义的 Unicode 序列? 尽管有许多“缺点”,但该功能有哪些“优点”使其成为 Java 的一部分?
【问题讨论】:
-
“首先,一个糟糕的程序员可以用它来......”一个糟糕的程序员会找到另一种让代码变得更糟的方法,即使没有 unicode 转义。
-
当然,一个糟糕的程序员总会想办法让代码变得更糟。我想说的是,Java 设计者做出了深思熟虑的决定,以尽量减少滥用。例如,多重继承、指针、宏和运算符重载在 C++ 中是常见的做法,但在 Java 中并未明确包含。
-
为了获得更多乐趣,请将
/\u002A移到最右侧,在 IDE 的视口之外。 -
@TiborBlenessy 因为那棵树不在 Unicode 的 BMP(基本多语言平面)中。 Java 允许在 Java 源代码中使用 BMP 中的任何字符。
-
@vurp0,这是完全错误的。也接受非 BMP。但是树被拒绝了,因为它的 unicode category 不是
LETTER_NUMBER。见docs.oracle.com/javase/7/docs/api/java/lang/…和stackoverflow.com/a/65490/632951
标签: java unicode language-features