【问题标题】:Checking for Page Rank Convergence检查页面排名收敛
【发布时间】:2016-12-09 20:55:26
【问题描述】:

我已经通过以下方式实现了页面排名收敛, 总结所有页面的所有页面排名分数并与之前的迭代进行比较。我的一位朋友给了我以下解释: “如果您查看 pagerank 论文,他们指出他们的实施将导致所有分数​​总和为 1,并且这些总和不会在多次迭代中改变。 这来自论文:“请注意,PageRanks 在网页上形成概率分布,因此所有网页的 PageRanks 之和将为 1”

找出页面排名算法是否收敛的正确方法是什么?请注意,我正在 Hadoop 和 spark 中实现页面排名。请指教,我很困惑。

【问题讨论】:

    标签: hadoop apache-spark pagerank


    【解决方案1】:

    您可以像在任何迭代算法中一样定义收敛。如果迭代之间估计参数的变化低于某个阈值算法收敛。

    【讨论】:

    • 对于谷歌页面排名算法,是否会在第二次迭代中获取所有页面的总页面排名并将其与第一次迭代工作进行比较?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-02-23
    • 1970-01-01
    • 2019-09-24
    相关资源
    最近更新 更多