【发布时间】:2015-11-20 00:02:26
【问题描述】:
我有一个压缩成 bz2 文件的 csv 文件,我试图从网站加载、解压缩并写入本地 csv 文件
# Get zip file from website
archive = StringIO()
url_data = urllib2.urlopen(url)
archive.write(url_data.read())
# Extract the training data
data = bz2.decompress(archive.read())
# Write to csv
output_file = open('dataset_' + mode + '.csv', 'w')
output_file.write(data)
在解压缩呼叫中,我收到IOError: invalid data stream。请注意,存档中包含的 csv 文件有很多字符,可能会导致一些问题。特别是,如果我尝试将文件内容放在 unicode 中,则会收到关于无法解码 0xfd 的错误。我在存档中只有一个文件,但我想知道由于未提取特定文件是否还会发生某些事情。
有什么想法吗?
【问题讨论】: