【发布时间】:2023-03-26 01:49:01
【问题描述】:
我正在考虑使用正则表达式来限制城市名称中的标点符号(全球)。什么是相当包容的白名单?
我在想:
(space)
. period
- hyphen
' apostrophe
还想可能是逗号或斜线,但我没有任何例子。还有其他人吗?
【问题讨论】:
-
我认为这就是所有这些......除了包含特殊字符的城市名称,如:Hōnaunau 或 San Josè 等。但我所知道的大多数城市数据库和网站都不使用任何这些特殊字符,基本上只是去掉这些字符并使用美国字母等效,例如 sa Honaunau 或 San Jose。
-
在美国,所有城市名称(根据 USPS,我相信是 USCB)都以 ASCII 格式存储在官方数据库中。在世界上,您必须考虑重音折叠。 (也许可以考虑,而不是限制输入,而是去掉不允许的标点符号……但在某些语言中,重音字符确实会影响含义和拼写。)
-
别忘了 Westward Ho! en.wikipedia.org/wiki/Westward_Ho!
-
“我正在考虑使用正则表达式来限制城市名称中的标点符号(全球)” - 为什么?
-
@User 如果你看不懂它的名字,这个城市不存在或者没有居民?
标签: regex street-address punctuation city