Tensorflow有三种读取数据的方式:

  • 定义placeholder占位符,通过feed_dict输入数据,从而实现数据的读取。(注意:程序运行时一定要给placeholder提供数据)
  • 预加载数据:在tensorflow的计算图中,定义常量或变量来保存所有的数据。(这种方法不适合于数据量大的情况,会出现显卡内存不足的情况)
  • 将数据保存到TFRecords文件,程序每次从TFRecords文件去读取数据,相当于每次从磁盘读取数据,适用于数据量大的情况。

这里主要介绍第一种和第三种数据读取方式。

  1. 定义placeholder占位符,通过feed_dict读取数据

  • placeholder有以下两种定义方式:

Tensorflow: 数据读取(feed_dict, TFRecord)

     第一种是直接给出了a的确定shape,在提供数据时,数据的shape只能是[2, 1];第二种方式,适用于模型训练时,训练样本数量不确定的情况,更具有灵活性,提供的数据可以是[2, 1] 也可以是[3, 1]。

  • 通过下面的代码来给placeholder提供数据:

Tensorflow: 数据读取(feed_dict, TFRecord)

其中a_x,b_x和a, b同shape,a_x 和b_x是非张量的数组等形式。

2. 从TFRecords中读取数据

  • 将数据写入TFRecords文件

TFRecords可以保存任意形式的数据,如文本,图像等。(因为时间有限,直接上代码)

Tensorflow: 数据读取(feed_dict, TFRecord)

通过以下代码来调用SeqtoTfrecord类,实现将数据写入TFRecord文件。

Tensorflow: 数据读取(feed_dict, TFRecord)

  • 从TFRecord文件中读取数据

还是直接上代码Tensorflow: 数据读取(feed_dict, TFRecord)

Tensorflow: 数据读取(feed_dict, TFRecord)

TFRecord在数据量大时非常适用,并且可以写入多种形式的数据,根据需要保存数据多种属性.

相关文章: