【发布时间】:2011-11-04 01:19:11
【问题描述】:
哪些 Unicode 字符(更准确地说是代码点)是危险的,应该被列入黑名单并禁止用户使用? 我知道 BIDI 覆盖字符和“零宽度空间”很容易出问题,但是还有什么其他的呢?
谢谢
【问题讨论】:
-
可以在布局中产生问题(如 BIDI 字符),发布空 cmets 之类的东西
-
这些对我来说听起来并不危险。有时你只需要小心处理:“希伯来字母是 אָלֶף־בֵּית עִבְרִי,从右到左书写。”
-
你不能阻止人们发布“空”的 cmets,你知道的。
-
我听说如果你转身 U+2423 会试图刺伤你。
-
@CatPlusPlus 实际上是 U+1F0AB,尤其是在 U+100CB 之后。
标签: unicode character sanitization blacklist