【问题标题】:python get unicode string sizepython获取unicode字符串大小
【发布时间】:2011-12-24 18:48:57
【问题描述】:

我有一个二进制文件。此文件包含一个 UTF-8 字符串。此外,保证该字符串只是一个单词。 在python中,如何获取这个字符串中的字母数?

假设我打开了这个文件并读取了字节:

bytes = open("1.dat", "rb").read()

接下来我要做什么来找出 UTF-8 字符串的长度(以字母为单位,而不是字节)?

【问题讨论】:

  • “保证这个字符串只是一个单词”的相关性是什么?
  • 不要以二进制模式打开文件。用codecs.open 打开它并给它一个编码参数。问题解决了。

标签: python utf-8 binaryfiles


【解决方案1】:
unicode_string = bytes.decode("utf-8")
print len(unicode_string)

【讨论】:

  • 在 Python 3 中,可以设置bytes = len(open('1.dat', encoding='utf-8').read())
猜你喜欢
  • 2012-01-20
  • 2018-09-08
  • 2023-03-20
  • 1970-01-01
  • 2011-05-13
  • 1970-01-01
  • 1970-01-01
  • 2011-06-25
  • 2011-03-31
相关资源
最近更新 更多