简短的回答:因为这不是 使用的特定转义。字符串表示仅使用单字符转义 \\、\n、\r、\t(当同时存在 " 和 ' 字符时加上 \'),因为对这些字符进行了显式测试.
其余部分要么被视为可打印并按原样包含,要么使用更长的转义序列包含(取决于 Python 版本和字符串类型,\xhh、\uhhhh 和 \Uhhhhhhhh,始终使用最短的3 个符合价值的选项)。
此外,在生成repr() 输出时,对于由一个空字节后跟一个从'1' 到'7' 的数字 组成的字符串(所以bytes([0x00, 0x49]) 或@987654337 @等),您不能只在输出中使用\0,而不必转义下一个数字。 '\01' 是一个八进制转义序列,与'\x001' 的值不同,它是两个字节。虽然强制输出始终使用三个八进制数字(例如'\0001')可能是一种解决方法,但坚持使用标准化、更简单的转义序列格式会更简单。向前扫描以查看下一个字符是否为八进制数字并切换输出样式只会产生令人困惑的输出(想象一下 SO 上的问题:'\x001' 和 '\0Ol' 之间有什么区别?)
输出是总是一致的。除了单引号(可以与' 或\' 一起出现,取决于" 字符的存在),Python 将始终对给定的代码点使用相同的转义序列样式。
如果你想研究产生输出的代码,你可以在Objects/unicodeobject.c unicode_repr() function 中找到 Python 3 str.__repr__ 实现,它使用
/* Escape quotes and backslashes */
if ((ch == quote) || (ch == '\\')) {
PyUnicode_WRITE(okind, odata, o++, '\\');
PyUnicode_WRITE(okind, odata, o++, ch);
continue;
}
/* Map special whitespace to '\t', \n', '\r' */
if (ch == '\t') {
PyUnicode_WRITE(okind, odata, o++, '\\');
PyUnicode_WRITE(okind, odata, o++, 't');
}
else if (ch == '\n') {
PyUnicode_WRITE(okind, odata, o++, '\\');
PyUnicode_WRITE(okind, odata, o++, 'n');
}
else if (ch == '\r') {
PyUnicode_WRITE(okind, odata, o++, '\\');
PyUnicode_WRITE(okind, odata, o++, 'r');
}
对于单字符转义,后面是额外的检查更长的转义。对于 Python 2,similar but shorter PyString_Repr() function 的作用大致相同。