【发布时间】:2021-11-30 06:10:13
【问题描述】:
我正在尝试使用 cuml ofrapids 来加速 dbscan 聚类 1500 万个 float64 数据点的过程。
''' pp = nb.cuda.to_device(ps) # ps是一个(15636915,2)的cupy数组
使用 cuml.using_output_type('input'): db_gpu = cumlDBSCAN(eps=0.8, min_samples=100,verbose=5).fit_predict(ps,out_dtype='int64') '''
但它的运行速度比在 cpu 上运行的ski-learn 慢得多。而且它没有占用我gpu的全部内存
【问题讨论】:
-
[[-230.19247437 43.1092453 ] [-225.90078735 41.32767487] [-222.15249634 33.68173981] ...数据看起来像这样
标签: gpu cluster-analysis dbscan rapids