【发布时间】:2021-07-28 02:03:18
【问题描述】:
我需要创建一个neural network,它将使用set of pictures 进行训练,例如 1000 张图片。然后我希望这个网络能够将video from camera 作为输入并检测它是否看到其中一张图片——但不是在整个屏幕上,而是例如作为printed picture on the wall。我想从中得到一些最有可能看到的照片。我不需要知道它们在输入图片中的位置,只需要知道它们是什么的信息。所以这个网络将不是分类器 - 我对这张图片的内容不感兴趣 - 只是这张图片的名称,或集合中的索引,或其他任何东西。是否有某种神经网络能够做这样的事情?可以是TensorFlow、CoreML 或MLKit 或其他任何内容。
【问题讨论】:
标签: ios tensorflow artificial-intelligence vision google-mlkit