【问题标题】:Training a neural network with two completely different datasets.用两个完全不同的数据集训练神经网络。
【发布时间】:2018-10-04 14:23:48
【问题描述】:
我现在正在使用神经网络进行对象分类。我正在创建用于训练和验证的数据集。我想知道是否可以创建两个包含两个完全不同的对象和标签的数据集进行训练。 (EG 数据集 1 有汽车,数据集 2 有猫)它是否仍然有效,或者我应该创建数据集,其中每个文件都混合了所有训练文件中的不同对象类型和标签?如果我用不同的数据集在一个周期中训练网络,这种混合/分离是否重要?
【问题讨论】:
标签:
deep-learning
dataset
training-data
【解决方案1】:
根据您用于训练的内容,许多 API(例如 TensorFlow 对象检测)会按顺序读取 TF 记录文件(数据集),因为它们会预先加扰以生成文件。加扰对于训练非常重要,因为您将让模型从一个类开始训练,然后在另一个单独的类中训练一点。它最终应该会达到相同的标准,但是对于模型而言,在训练步骤的类别分布上均等分布的情况下要好得多。