【问题标题】:Python: Load File Contains All Unicode Characters [duplicate]Python:加载文件包含所有Unicode字符[重复]
【发布时间】:2016-06-01 17:36:59
【问题描述】:

我有一个包含以下数据的文本文件:

<miscellaneous text for several lines>
User ID    Name
USERA      Test User 1
USERB      Test User 2
....
<more miscellaneous text for several lines>

我正在尝试提取用户 ID 和名称,以便将其输出到 .csv 文件中。所以我想第一步是加载文件并将文本文件的内容放入字符串中

这是我的代码:

with open('FILE.txt', 'rb') as f:
    file = f.read()
    print(file)

但这会输出以下内容:

为什么加载 unicode NULL 字符?我能做些什么来解决这个问题?

另外,有没有更有效的方法来做到这一点?我的计划是只进行正则表达式匹配,但这不是很有效

【问题讨论】:

  • 文本文件可能以不同的编码进行编码。在open 中使用encoding 关键字。
  • 这是常规的 ASCII 零字节;它们也恰好是 Unicode 零(和 Latin-1 零等),但这在这里几乎不相关。

标签: python python-3.x unicode


【解决方案1】:

看起来该文件使用 UTF-16。使用正确的编解码器应该没问题。

【讨论】:

    猜你喜欢
    • 2012-04-04
    • 2016-12-19
    • 2013-04-10
    • 2020-05-06
    • 2011-01-28
    • 2022-07-19
    • 2017-09-01
    • 2012-11-21
    • 2011-09-10
    相关资源
    最近更新 更多