【发布时间】:2016-06-01 17:36:59
【问题描述】:
我有一个包含以下数据的文本文件:
<miscellaneous text for several lines>
User ID Name
USERA Test User 1
USERB Test User 2
....
<more miscellaneous text for several lines>
我正在尝试提取用户 ID 和名称,以便将其输出到 .csv 文件中。所以我想第一步是加载文件并将文本文件的内容放入字符串中
这是我的代码:
with open('FILE.txt', 'rb') as f:
file = f.read()
print(file)
为什么加载 unicode NULL 字符?我能做些什么来解决这个问题?
另外,有没有更有效的方法来做到这一点?我的计划是只进行正则表达式匹配,但这不是很有效
【问题讨论】:
-
文本文件可能以不同的编码进行编码。在
open中使用encoding关键字。 -
这是常规的 ASCII 零字节;它们也恰好是 Unicode 零(和 Latin-1 零等),但这在这里几乎不相关。
标签: python python-3.x unicode