【发布时间】:2015-03-26 06:38:50
【问题描述】:
当我尝试制作一个按密度着色的散点图时,它需要很长时间。
可能是因为数据的长度比较大。
这基本上是我的做法:
xy = np.vstack([np.array(x_values),np.array(y_values)])
z = gaussian_kde(xy)(xy)
plt.scatter(np.array(x_values), np.array(x_values), c=z, s=100, edgecolor='')
作为附加信息,我必须补充一点:
>>len(x_values)
809649
>>len(y_values)
809649
是否有其他选择可以获得相同的结果但速度更快?
【问题讨论】:
-
您是否测试过是
scatter函数本身运行缓慢,还是运行plt.show或plt.savefig时出现运行缓慢? -
标题具有误导性。您正在为大型数据集执行
KDE。 -
完全正确的 cel,缓慢发生在
z = gaussian_kde(xy)(xy)我改变它 -
@newPyUser 你用什么代替了
gaussian_kde?你说过你会改变它。 -
降低 KDE 的带宽,使用更快的内核(例如线性)并且不要用散点图绘制 80000 个点。
标签: python performance kernel-density