这是一篇Yahoo比较早期(08年)的使用机器学习模型来解决query-ad相关性的文章,deep learning还没有流行起来,所以现在看起来还比较naive,看这篇主要是其中一处对position bias的处理。

全部文章的细节就不描述,对早期业界方法感兴趣的可以看看,那时候猜测还没有流行起来直接使用点击数据来作为label来计算点击率(文章中有背景介绍),其余的其实跟现有框架的差不多,也是提特征,然后训练模型,只是现在的模型结构更复杂了些。

下面介绍下对position bias的处理。

考虑以下场景:用户输入了query,然后搜索引擎返回了一页结果,用户会浏览并且点击感兴趣的链接。

这样一个场景属于典型的存在position bias,假设有两个广告ad1和ad2,且ad1位于ad2的上面,若点击ad1但未点击ad2,并不能说明ad1是更相关的,可能仅仅是因为它在更上面。但如果用户点击ad2但未点击ad1, 那我们就更有理由相信ad2比ad1更相关,利用这样的假设,就可以组成pair对。文章中的构造方式如下:

【position bias 2】Online Learning from Click Data for Sponsored Search

右侧每个阴影的地方构成block,每个block包括以下:最下面属于代表被点击,而其上则是位置更靠上则没有被点击的,然后在训练的时候可以采用pair形式的训练方式。

当然更具体的细节可以看原始论文,讲的比较清楚。

相关文章:

  • 2021-04-24
  • 2021-05-29
  • 2022-12-23
  • 2021-06-07
  • 2022-12-23
  • 2021-10-20
  • 2021-09-21
  • 2021-10-01
猜你喜欢
  • 2021-07-03
  • 2021-08-28
  • 2022-01-07
  • 2021-07-21
  • 2022-01-05
  • 2021-09-13
  • 2021-05-27
相关资源
相似解决方案