【发布时间】:2011-12-24 18:48:57
【问题描述】:
我有一个二进制文件。此文件包含一个 UTF-8 字符串。此外,保证该字符串只是一个单词。 在python中,如何获取这个字符串中的字母数?
假设我打开了这个文件并读取了字节:
bytes = open("1.dat", "rb").read()
接下来我要做什么来找出 UTF-8 字符串的长度(以字母为单位,而不是字节)?
【问题讨论】:
-
“保证这个字符串只是一个单词”的相关性是什么?
-
不要以二进制模式打开文件。用
codecs.open打开它并给它一个编码参数。问题解决了。
标签: python utf-8 binaryfiles