【发布时间】:2021-07-15 20:28:45
【问题描述】:
我有 128 个嵌入向量
image.shape = torch.Size([128, 512])
text.shape = torch.Size([128, 512])
我想计算包含所有元素之间余弦相似度的张量(即:
cosine.shape = torch.Size([128, 128])
其中第一行是第一张图片与所有文本的余弦相似度(128)等
目前我只是这样做,但结果是一个仅包含 N 个余弦相似度的一维数组。
cosine_similarity = torch.nn.CosineSimilarity()
cosine = cosine_similarity(image, text)
我该怎么做?我尝试转置文本,但没有成功
【问题讨论】: