【发布时间】:2021-04-26 12:30:48
【问题描述】:
我一直在使用 Python 的 PYOD 库,并且一直在使用 LOF、LOCI 和 CBLOF 算法。现在我想转而使用 Pyspark。我在 pyspark MLlib 上做了一些 RnD。但是,我还没有在 Pyspark 中找到 LOF、LOCI 或 CBLOF 的实现。我想知道以下内容:
- Pyspark 中是否有 LOF、LOCI、CBLOF 实现?
- 如果不是问题 1,如何将 PyOD 库算法与 pyspark 集成。所以我可以使用 PySpark 对数据进行预处理,并使用 PyOD 中实现的算法进行训练。
如果有参考请分享。谢谢你
【问题讨论】:
标签: python apache-spark pyspark scikit-learn outliers