【问题标题】:Caffe+Opencv without lmdb没有 lmdb 的 Caffe+Opencv
【发布时间】:2016-01-15 10:08:52
【问题描述】:

使用 caffe 时,要创建包含图像的训练数据集,我们需要创建 lmdb 等特殊格式的数据库,但可以选择传递给 caffe 批量图像,例如 vector<cv::Mat>

为了澄清,我正在寻找可以处理大量无法放入内存的图像的解决方案(但假设一个训练批次(例如包含 50 张图像)可以存储在内存中)。

【问题讨论】:

    标签: c++ opencv caffe lmdb


    【解决方案1】:

    Caffe 可以接受多种类型的输入,具体取决于我们使用的输入层。 一些可用的输入法是:

    1. 数据
    2. 内存数据
    3. HDF5Data
    4. 图像数据等

    在模型文件中,您找到的第一层将是Layer type: Data,它使用lmdb or leveldb 作为输入法。将一组图像转换为这些数据库非常容易,因为 Caffe 已经提供了转换图像的工具。

    Layer type: MemoryData 直接从内存中读取数据,这在测试阶段使用相机输入作为 Caffe 输入传递时非常有用。强烈建议使用此层进行训练。

    Layer type: ImageData 将文本文件作为输入。文本文件包含所有图像名称及其完整路径和类别编号。 Caffe 使用 OpenCV 读取该层中的图像。它还负责对图像的所有转换。因此,建议不要使用 OpenCV 读取图像然后传递给 MemoryData 层,而是使用 ImageData。

    ImageData层读取图片的.txt格式必须为:

    /path/to/the/image/imageName.jpg classNumber

    强烈建议使用 LMDB 或 LevelDB,因为如果图像路径或名称包含空格,或者任何图像损坏,ImageData 将无法正常工作。

    各个层的详细信息可以找到here

    根据模型和批量大小在 GPU 中分配内存。如果发生内存溢出,您可以尝试减小批量大小。 Caffe 轻松处理了包含 120 万张图像的 Imagenet 数据库的训练。因此,在最佳批量大小的情况下,算法应该可以正常工作。

    【讨论】:

    • 为什么不推荐在训练中使用 MemoryData?从 lmdb 和 ImageData 读取的速度也有差异吗?
    • 不建议初学者使用 MemoryData,因为如果训练没有按预期进行,可能会使事情变得困难。此外,MemoryData 层不推荐对图像进行的转换,这意味着在未来的版本中使用 MemoryData,平均图像减法、裁剪、调整大小等将在外部完成,然后再将数据传递到 memorydata 层。
    猜你喜欢
    • 1970-01-01
    • 2016-02-11
    • 2016-01-12
    • 1970-01-01
    • 2016-03-24
    • 2018-01-07
    • 2019-05-01
    • 1970-01-01
    • 2017-05-06
    相关资源
    最近更新 更多