【问题标题】:How to plot the difference of two distributions in a seaborn?如何绘制seaborn中两个分布的差异?
【发布时间】:2018-03-26 09:20:56
【问题描述】:

我有以下代码来比较两个分布:

sns.kdeplot(df['term'][df['outcome'] == 0], shade=1, color='red')
sns.kdeplot(df['term'][df['outcome'] == 1], shade=1, color='green'); 

看起来像这样:

如何仅绘制两个分布(disA - disB)的差异?当然,它可以包含负值。

【问题讨论】:

    标签: python matplotlib seaborn


    【解决方案1】:

    由于两条 kde 曲线之间的差异不是 kde 曲线本身,因此您不能使用 kdeplot 来绘制差异。

    使用scipy.stats.gaussian_kde 可以轻松计算kde。结果很容易用 pyplot 绘制。

    import numpy as np; np.random.seed(0)
    import matplotlib.pyplot as plt
    import scipy.stats
    
    a = np.random.gumbel(80, 25, 1000)
    b = np.random.gumbel(90, 46, 4000)
    
    kdea = scipy.stats.gaussian_kde(a)
    kdeb = scipy.stats.gaussian_kde(b)
    
    grid = np.linspace(0,500, 501)
    
    plt.plot(grid, kdea(grid), label="kde A")
    plt.plot(grid, kdeb(grid), label="kde B")
    plt.plot(grid, kdea(grid)-kdeb(grid), label="difference")
    
    plt.legend()
    plt.show()
    

    请注意,结果实际上只是曲线之间的差异(如所要求的那样);它根本没有统计相关性。

    【讨论】:

    • 太可惜了! Seaborn海图更酷,呵呵,非常感谢!
    • 由于 seaborn 图表 matplotlib 图表,我看不出它们如何“更酷”。
    • 是的,您可以通过添加import matplotlib as mpl; mpl.style.use('seaborn')轻松切换到seaborn风格
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-11-03
    • 2020-03-30
    • 1970-01-01
    • 2018-03-08
    • 2019-11-26
    • 1970-01-01
    • 2021-09-05
    相关资源
    最近更新 更多