【发布时间】:2014-06-12 18:42:15
【问题描述】:
我将 SQLite3 表(来自 Anki 平台)转储到 CSV 文件中。我发现 sfld 列是用 ^_ 分隔的。
Unicode 中的这个字符或转义字符是什么?
【问题讨论】:
标签: unicode encoding character-encoding sqlite unicode-escapes
我将 SQLite3 表(来自 Anki 平台)转储到 CSV 文件中。我发现 sfld 列是用 ^_ 分隔的。
Unicode 中的这个字符或转义字符是什么?
【问题讨论】:
标签: unicode encoding character-encoding sqlite unicode-escapes
它是一个控制下划线 (Control-_),或 0x1F,或来自 ASCII(以及 ISO 8859-x 和 Unicode)控制字符的单位分隔符。
ASCII、ISO 8859-x 和 Unicode 中的大写字母有代码点(所有数字均为十六进制):
41 U+0041 LATIN CAPITAL LETTER A
…
5A U+005A LATIN CAPITAL LETTER Z
后面的字符是:
5B U+005B LEFT SQUARE BRACKET
5C U+005C REVERSE SOLIDUS
5D U+005D RIGHT SQUARE BRACKET
5E U+005E CIRCUMFLEX ACCENT
5F U+005F LOW LINE
像 Control-A 这样的控制字符的代码比大写字母小 0x40,所以你有
01 U+0001 START OF HEADING (aka SOH or Control-A)
…
1A U+001A SUBSTITUTE (aka SUB or Control-Z)
然后你得到:
1B U+001B ESCAPE (aka ESC or Control-[)
1C U+001C FILE SEPARATOR (aka FS or Control-\)
1D U+001D GROUP SEPARATOR (aka GS or Control-])
1E U+001E RECORD SEPARATOR (aka RS or Control-^)
1F U+001F UNIT SEPARATOR (aka US or Control-_)
【讨论】: