【发布时间】:2017-05-20 19:10:21
【问题描述】:
尝试在 python 中读取二进制文件。来自dataset page:
像素存储为无符号字符(1 字节)并从 0 到 255
我尝试了以下方法,它打印 (0,),而不是 784,000 位数组。
# -*- coding: utf8 -*-
# Processed MNIST dataset (http://cis.jhu.edu/~sachin/digit/digit.html)
import struct
f = open('data/data0', mode='rb')
data = []
print struct.unpack('<i', f.read(4))
如何将此二进制文件读入 784,000 位数组(28 字节 x 28 字节 x 1k 样本)或 28x28x1000 3D 数组。我以前从未使用过二进制文件,现在很困惑!
【问题讨论】:
-
只是深思,一些现有的工作使用 Python 读取 MNIST 数字图像。 github.com/sorki/python-mnist/blob/master/mnist/loader.py
标签: python arrays python-2.7 file binaries