【发布时间】:2016-12-09 20:55:26
【问题描述】:
我已经通过以下方式实现了页面排名收敛, 总结所有页面的所有页面排名分数并与之前的迭代进行比较。我的一位朋友给了我以下解释: “如果您查看 pagerank 论文,他们指出他们的实施将导致所有分数总和为 1,并且这些总和不会在多次迭代中改变。 这来自论文:“请注意,PageRanks 在网页上形成概率分布,因此所有网页的 PageRanks 之和将为 1”
找出页面排名算法是否收敛的正确方法是什么?请注意,我正在 Hadoop 和 spark 中实现页面排名。请指教,我很困惑。
【问题讨论】:
标签: hadoop apache-spark pagerank