这是CVPR2017的一篇做cross-modal retrieval的文章,paper和相关数据代码链接http://im2recipe.csail.mit.edu/,作者的homepage https://imatge.upc.edu/web/people/amaia-salvador
文章要做的事情(recipe retreival):
输入:image(sentence)+dataset      输出:sentence(image) rank list

method
文章的framework如下所示。
Learning Cross-modal Embeddings for Cooking Recipes and Food Images
主要是将文本和图像映射到共享的子空间,然后在子空间上做cosine similarity loss和softmax loss。

相关文章:

  • 2021-07-12
  • 2021-07-15
  • 2021-11-02
  • 2021-08-23
  • 2021-04-21
  • 2021-07-18
  • 2021-08-02
  • 2021-08-22
猜你喜欢
  • 2022-01-12
  • 2021-06-21
  • 2021-06-26
  • 2021-08-05
  • 2021-11-19
  • 2022-12-23
相关资源
相似解决方案