R语言的核密度渲染弄完了,今天来看看Python的核密度。本来没准备些Python,但是今天在玩seaborn包的时候,发现了强大的kdeplot这样一样工具,让虾神我惊为天人,不写感觉都对不起这个方法。六种核密度方法和多种带宽模式,如下:
gau (Gaussian)
cos(Cosine)
biw(Quartic(biweight))
epa(Epanechnikov)
tri (Tricube)
triw (Triweight)
细微,垂直看下去,几乎可以忽略不计),但是如果平铺开来,比如我就用纬度进行密度分析,就可以看出不同来了,如下:
ArcGIS里面,使用的是eqa(Epanechnikov:抛物面核或者叫做二次核函数)。当然,如果不是做专业、深入的分析和理论研究,仅用核密度做定性分析的话,任何一种核函数,在使用意义上都是一样的。
scott (斯考特带宽法)
silverman (西尔弗曼带宽法)
scalar (标量带宽法)
pair of scalars (标量对带宽法)
seaborn.kdeplot(data, data2=None, shade=False, vertical=False,
kernel='gau', bw='scott', gridsize=100, cut=3, clip=None, legend=True, cumulative=False, shade_lowest=True, ax=None, **kwargs)shade: 是否进行填充,如果为False,那么就表示进行核密度线表示,如下:
vertical:表示以X轴进行绘制还是以Y轴进行绘制,如下:
gridsize:这里这个参数与ArcGIS里面的cellsize以及R语言里面的gridsize都不一样,这个参数指的是每个格网里面,应该包含多少个点,越大,表示格网里面的点越多,越小表示格网里面的点越少(看作cellsize的反义词就好了,也就是越大越平滑)如下:
cumulative :是否绘制累积分布,如下:
shade_lowest : 是否有最低值渲染,这个参数只有在二维密度图上才有效,结果如下:
clip:表示查看部分结果,如下:图1只查看-100至-100区间内的数据:
cut参数表示,绘制的时候,切除带宽往数轴极限数值的多少,这个参数可以配合bw参数使用,如下:
matplotlib的参数,不在赘述。