【发布时间】:2012-04-26 17:14:27
【问题描述】:
有没有办法在 Python 中识别文本文件是否为 UTF-8?
我真的很想知道文件是否为 UTF-8。我不需要检测其他编码。
【问题讨论】:
-
我要求检测 UTF-8(真/假),而不是所有编码。
-
您可以以很高的置信率进行猜测,除非您对无法确定的文件内容了解得更多。例如,文件的类型(在这种情况下,您要求的是文本文件)。大多数时候你可以猜到。去年我遇到过几次这就是为什么:)
-
@Riki137 如果您知道替代方案是单字节编码,我添加了一些有关检测 UTF-8 的信息。
标签: python unicode utf-8 character-encoding