【问题标题】:Pagerank - TroublePagerank - 麻烦
【发布时间】:2011-06-12 08:56:33
【问题描述】:

我将向您展示 2 个场景(N.B. d=damping factor=0.5)

第一种情况:假设有4个节点A, B, C, D

  • B, C, DA 上的链接。

PageRank 是: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

我可以通过将0.25 放在PR(B)=PR(C)=PR(D) 上来解决这个等式,我将得到 0.875as 的值。我不需要解析任何系统

第二种情况:假设有4个节点A, B, C, D

  • A BC 上的链接
  • BC上的链接
  • CA 上的链接

这样,PageRank 将是:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

我必须解决这个系统才能得到结果。我没有把1/N放在PR(A), PR(B), PR(C) and PR(D)

事实上,我在互联网上搜索解决方案和值是:

$PR(A) = 14/13 = 1.07692308$

$PR(B) = 10/13 = 0.76923077$

$PR(C) = 15/13 = 1.15384615$

那么为什么在两个相似的场景中我会使用两种不同的行为呢?

希望有人可以帮助我 :) 干杯

【问题讨论】:

  • 好问题。但是,它与数学有关。
  • 嗯...有没有像 StackOverflow 这样的数学论坛? :)
  • 发现数学“溢出”。难以置信:没有pagerank标签o_O
  • 是的,我在那里发布了一个主题,但正如我所说,没有 pagerank 标签! :)

标签: algorithm math pagerank


【解决方案1】:

由于第一个问题中的对称性,这两种情况是不同的:B、C 和 D 链接到同一个页面并从同一个页面链接(即它们都指向 A,而没有任何东西指向它们)。因此它们的页面排名将相同,这给您提供了 PR(B)=PR(C)=PR(D) 的额外约束,使您可以轻松解决问题。

第二个问题没有对称性,必须长期解决。

【讨论】:

    【解决方案2】:

    假设有四个网页:A、B、C 和 D。从一个页面到其自身的链接,或从一个页面到另一个页面的多个出站链接都将被忽略。 PageRank 被初始化为所有页面的相同值。在 PageRank 的原始形式中,所有页面的 PageRank 之和是当时 Web 上的总页面数,因此本示例中的每个页面的初始 PageRank 将为 1。但是,更高版本的 PageRank 和本节的其余部分,假设概率分布在 0 和 1.因此每页的初始值为0.25。

    在下一次迭代时从给定页面转移到其出站链接目标的 PageRank 在所有出站链接之间平均分配。

    如果系统中仅有的链接是从页面 B、C 和 D 到 A,则每个链接将在下一次迭代时将 0.25 PageRank 转移到 A,总共 0.75。

    PR(A)= PR(B) + PR(C) + PR(D)

    假设页面 B 具有指向页面 C 和 A 的链接,页面 C 具有指向页面 A 的链接,页面 D 具有指向所有三个页面的链接。因此,在下一次迭代中,页面 B 会将其现有值的一半,即 0.125,转移到页面 A,将另一半,或 0.125,转移到页面 C。页面 C 将其所有现有值,即 0.25,转移到唯一的它链接到的页面,A。由于 D 有三个出站链接,它会将其现有值的三分之一(大约 0.083)转移到 A。在此迭代完成时,页面 A 的 PageRank 将为 0.458。

    PR(A)= \frac{PR(B)}{2}+ \frac{PR(C)}{1}+ \frac{PR(D)}{3}.\,

    换句话说,出站链接赋予的 PageRank 等于文档自身的 PageRank 分数除以出站链接数 L( )。

    PR(A)= \frac{PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D )}。

    一般情况下,任何页面u的PageRank值可以表示为:

    PR(u) = \sum_{v \in B_u} \frac{PR(v)}{L(v)},

    即页面 u 的 PageRank 值取决于集合 Bu(包含链接到页面 u 的所有页面的集合)中每个页面 v 的 PageRank 值除以来自页面 v 的链接数 L(v)。

    For further queries visit here

    【讨论】:

      猜你喜欢
      • 2010-11-11
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多