【发布时间】:2020-03-15 03:28:03
【问题描述】:
我正在删除或替换在 Web 应用程序的文本区域字段中使用的字符串(在 Java 中)中的杂项符号。发生的情况是,当我使用下面的内容时,内容被转换为 unicode十进制表示值。
内容是: 字符串 a = '最后搜索结果公告板 验证 ⛔ 0 ⚡ 1 ⚠ 6 ? 0'
当我将该内容保存在文本区域(即网页中)时,该符号将保存为 ⛔,⚡,⚠.
我想删除 unicode 表示值(或)以正确的格式保存内容,以便我可以将正确的数据保存到数据库中。
如何从字符串中删除符号(“⛔”或“⚡”或“⚠”)的 Unicode 表示值? 实际上我试图用正则表达式来替换下面的那些表示 s.replaceAll("[9728 - 9983];", "")。范围 [9728 - 9983] 表示杂项符号 unicode 十进制值范围。但它没有正确替换它。 我可以使用哪个正则表达式?或者可以使用哪种方法来删除字符串中的值?
(或)
如何在字符串中将 unicode 表示值('⛔' 或 '⚡' 或 '⚠')再次转换为相同的符号(⛔ ,⚡ ,⚠ )?
【问题讨论】:
标签: java string unicode symbols