MI-短视频学习

1.部分一级标签重复性较强,导致内容重叠性以及分类不明确。

例如:    人物标签就与多个标签重叠,导致标签重复从而导致推荐内容可能过少。

(类似的有[地区,旅游],[时尚,女装,美妆,购物],[购物,居家,母婴,女装],[政府,国际,时政,地区])

视频标签问题

2.一级标签过多导致视频开始识别的时候视频的分类界限模糊,同时导致二级标签无法分别成很多类。(可以进行相关性整合,降低一级标签的耦合提高二级标签的界限)

视频标签问题

  例如:明星的名字可能出现在电影,电视剧,综艺等,如果都放在娱乐里面,那明星一定属于娱乐,然后设置电影名字为优先级,就可以精确识别视频的分类。

视频标签问题

3.居家中的关于疾病的标签(错误标签)score很高,但是移动到健康(正确标签)中score异常低。导致关于健康的视频很难被识别,容易被其他的类所占有。

例如:豚骨头坏死的早期信号。(在“居家”–“豚骨头坏死” score:12,“信号” score:1,但是移到“健康”—“豚骨头坏死” score:0.0068,“信号” score:1 )

正常来说“健康”标签中的关键词不会差很多,但是现在健康类中疾病的评分太低了。(以前分错的标签移动后好像都有点,例如 美妆–历史,居家–健康)

4.一级分类“美妆”中二级分类“化妆品-160”已经转移到“国际”–“国际组织”(已经解决),“美妆”中“未分类-161”中标签基本上都是错误的类别需要重新分类(3267条记录–人工可以调整-——正在调整)。

一级分类“政府”中二级分类“慈善组织-167”和“未分类-168”中也存在不少标签不正确。

5.一级分类“电影”和“电视剧”的视频,因为作者可能取的名字中含有“娱乐”而被识别成“娱乐”类。

例如:

视频标签问题

因为这三个类都含有相同的关键词,容易产生模糊。

相关文章:

  • 2021-12-15
  • 2022-03-03
  • 2021-08-29
  • 2021-06-14
  • 2021-11-12
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-08-06
  • 2021-08-01
  • 2022-02-18
  • 2021-08-26
  • 2021-08-16
  • 2022-12-23
相关资源
相似解决方案