性能优势


新版本的Angel,添加了诸多新功能,最终的目的,就是让算法工程师能更加从容地进行算法优化,融入更多的算法的Trick,让算法的性能,得到了一个飞跃的提升。


相关性能的细节数据,在Github的各个算法介绍文档都可以看到,欢迎点击文末“阅读原文”移步GitHub。



1.GBDT

众所周知,XGBoost的强项之一,就是GBDT算法,性能飞快,使用简单,在众多算法比赛中,是选手们的最爱。尽管如此,Angel的GBDT算法,却还是超越了它,这是一个非常不错的性能背书。


  • 性能比较

Angle和XBGoost以及Spark的性能对比Angle和XBGoost以及Spark的性能对比
  • 数据:腾讯内部某性别预测数据集,3.3×10^5 特征,1.2×10^8 样本

  • 详细文档:GBDT on Angel



2.LDA

众所周知,LDA是一个非常消耗资源的主题模型算法,新一代的Angel,在LDA上的性能,不但超越了Spark,也已经超越了之前开源过的Petuum。(由于Petuum已经不开源多时,所以比对数据,这里就不再贴出了)

Angle和XBGoost以及Spark的性能对比Angle和XBGoost以及Spark的性能对比
  • 数据:PubMED

  • 详细文档: LDA on Angel



3.GD-LR

LR是广告推荐中广泛应用的一个算法,Angel分别提供了利用Gradient Descent、ADMM两种优化方法计算的LR算法。这两种算法,无论是耗费的资源,还是性能、收敛速度,都远比原生的Spark实现优越。


  • GD-LR

Angle和XBGoost以及Spark的性能对比Angle和XBGoost以及Spark的性能对比
  • 数据: 腾讯内部某推荐数据,5×10^7 特征,8×10^7 样本

  • 详细文档: LR on Angel


  • ADMM-LR

Angle和XBGoost以及Spark的性能对比Angle和XBGoost以及Spark的性能对比
  • 数据:腾讯内部某推荐数据,5千万特征,1亿样本

相关文章:

  • 2022-12-23
  • 2021-06-04
  • 2021-05-15
  • 2022-12-23
  • 2021-09-22
  • 2022-12-23
  • 2021-11-25
  • 2021-07-26
猜你喜欢
  • 2022-12-23
  • 2021-09-21
  • 2021-11-05
  • 2021-11-27
  • 2022-12-23
  • 2022-02-27
相关资源
相似解决方案