推荐系统和信息检索的共同点是基于度量(例如相关性)优化评分,然后输出。在从多个指标中选择一个或加权的情况下,我认为我本质上必须在政治上进行选择,所以我把脑子里的东西都吐出来了。 (即关于是否可以称其为“科学”的思想实验)
公式
- 有两个指标$A、B$负相关。
- 你想要的分数 $V$
- 搜索和浏览等操作$W$
- 一个参数$lpha$
- $Y=f(V,W,lpha)$ 对每个元素进行评分。
- 将 $V$ 和 $W$ 的元素视为维度 $d$ 的向量。
- 有一个基于 $Y$ 的排序顺序 $g(Y)$。
- 当使用索引 $A$ 进行评估时,令 $Z_{A}=h(g(Y),A)$。类似地,可以表示 $Z_{B}$。
- 随着 $lpha$ 增加,$Z_{A}$ 增加。
- $Z_{B}$ 随着 $lpha$ 的减少而增加。
然后找到一个“合理”的方法来确定$f$。
绝对优势
给定两个函数 $f_1, f_2$,考虑 $V,W$ 固定,$f_1(lpha)_A > f_2(lpha)_A$, $f_1(lpha)_B > $lpha$ 对于任何值 If f_2(lpha)_B $,则 $f_1$ 被认为是优越的。我认为这是一种理性。
假设我们在单个索引 $A$ 中有一个评估 $f,g$,并且当与 $g(x)=1-0.5, f(x)=1-x$, $x in [0,1] 进行比较时$in ,$g$ 与 $f$ 相比具有绝对优势。
添加索引 $B$ 时,这个估计是 $g(x)=0.5x+0.5, f(x)=x$, $x 在 [0,1]$ 范围内 $g$ 是 $f$ 相比的绝对优势$g = (g_A, g_B) = (1-0.5x, 0.5x+0.5)$, $f=(f_A, f_B)=(1-x, x)$ 在每个索引 $A,B$ $g$与 $f$ 相比具有绝对优势
如果你没有绝对优势
$g = (g_A, g_B) = (1-0.5x, x)$, $f=(f_A, f_B)=(1-x, 0.5x+0.5)$ 做好准备并不会给你带来绝对优势。因此,我们通过每个索引的 [0,1]$ 中的 $x 中的加权和来考虑不等式。
int_{0}^{1}(a(-x+1)+b(0.5x+0.5))dx < int_{0}^{1} (a(-0.5x+1)+bx)dx
那么当$b < a$ 时,这个解将满足这个不等式。如果不等式反转,$a < b$。换句话说,$a < b$ 就像在说“一个指标比另一个指标更重要”。
衡量的是政治吗?
设 A 和 B 称为目标。一旦选择了一个目标,它就变成了最大化或最小化它的问题。但是,这里的问题是,如果有多个目标,并且要选择或加权一个目标,则除非假设某种“政治”,否则无法选择目标和权重。
示例 1:搜索引擎
搜索引擎发布“评分者指南”。
https://support.google.com/websearch/answer/9281931?hl=ja
搜索引擎可能会通过算法为政治辩护,但它们可能不是“科学”。指南本身是如何制定的?单纯的科学能否决定创建指南的行为?
(虽然是多余的,但有可能将帕累托效率和功利主义等标准纳入指导方针,但SEO公司应对黑客攻击的改进是以SEO行业的劣势为前提的,因此它们不是帕累托改进. . ,真正的搜索引擎可能更接近功利主义。无论如何这些都是政治。)
示例 2:商业目的
假设利益相关者是广告提供者和用户。两者的利益通常是不一致的。是否有一种科学的方法来衡量优先考虑哪个利益相关者?
另一方面,有人可能会说“权重是根据利润优化确定的”,但举个简单的例子,利润的上层目的是给CSR和利润一定的权重,不是吗。最高目标的权重如何确定? (说只要可以最大化利润就可以展示欺诈性广告,和说在排除道德上不可接受的那些之后利润最大化是有区别的。)
或者是否有一个至高无上的目的,一直在重复,不再是政治性的?如果最终需要其他机制,如独裁、投票等,那将是政治,而不是科学。
示例 3:HR AI 注释
以“想要优秀的人力资源”为目的,假设通过将员工信息与绩效相关联来进行注释,并在招聘时使用经过训练的模型。有没有一个绝对的标准可以唯一科学地决定性能?其实并没有这种东西,指标就是“我们认为的表现”。不用说,在确定这个指数的阶段,政治已经在发生。
这甚至只是偏见。如果过去女性的表现受到偏见,该模型很可能会成为这种偏见的倡导者。你不能称它为“科学”。算法并不是崇高的,它们是插入模型的意见。
示例 4:Like 机制
假设社交媒体使用喜欢的数量(也可以认为是权重)来确定出现在顶部的内容。这是喜欢和不喜欢的集合,或者投票,投票就是政治。基于点赞数的决定既不科学,也不代表“绝对价值”。 (社会建构主义者认为这是一个绝对值。)
参考
原创声明:本文系作者授权爱码网发表,未经许可,不得转载;
原文地址:https://www.likecs.com/show-308631736.html