【问题标题】:Stacked density plots with pandas and seabornpandas 和 seaborn 的堆积密度图
【发布时间】:2019-07-10 18:15:07
【问题描述】:

我正在尝试从 pandas 数据框中获取以下图。

我不确定如何将 seaborn 与 pandas 结合起来完成这项任务。

这是我要使用的数据框:

import pandas as pd

data = pd.DataFrame({'a': np.random.randn(1000) + 1,
              'b': np.random.randn(1000),
              'c': np.random.rand(1000) + 10},        
             columns=['a', 'b', 'c'])

data.a[data.a.sample(100).index] = np.NaN
data.b[data.b.sample(800).index] = np.NaN

请注意,需要对频率进行归一化(直方图的高度),因为数据点的数量和分布存在显着差异,并且分布将具有不同的“y 尺度”。

data.plot.hist();

这是seaborn的代码,生成我一开始使用的图形。

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style="white", rc={"axes.facecolor": (0, 0, 0, 0)})

# Create the data
rs = np.random.RandomState(1979)
x = rs.randn(150)
g = np.tile(list("ABC"), 50)
df = pd.DataFrame(dict(x=x, g=g))
m = df.g.map(ord)

# Initialize the FacetGrid object
pal = sns.cubehelix_palette(10, rot=-.25, light=.7)
g = sns.FacetGrid(df, row="g", hue="g", aspect=5, height=1, palette=pal)

# Draw the densities in a few steps
g.map(sns.kdeplot, "x", clip_on=False, shade=True, alpha=1, lw=1.5, bw=.2)
g.map(sns.kdeplot, "x", clip_on=False, color="w", lw=2, bw=.2)
g.map(plt.axhline, y=0, lw=2, clip_on=False)


# Define and use a simple function to label the plot in axes coordinates
def label(x, color, label):
    ax = plt.gca()
    ax.text(0, .3, label, fontweight="bold", color=color,
            ha="left", va="center", transform=ax.transAxes)


g.map(label, "x")

# Set the subplots to overlap
g.fig.subplots_adjust(hspace=-.0025)

# Remove axes details that don't play well with overlap
g.set_titles("")
g.set(yticks=[])
g.despine(bottom=True, left=True)

【问题讨论】:

    标签: python pandas seaborn


    【解决方案1】:

    这是一个创建 kde 图网格(“joyplot”)的函数,每个数据框列一个图。

    import matplotlib.pyplot as plt
    import numpy as np
    from scipy.stats import gaussian_kde
    
    
    def joyplot_from_dataframe(data, cmap=None):
        mi, ma = np.nanmin(data.values), np.nanmax(data.values)
        minx = mi - (ma-mi)/5
        maxx = ma + (ma-mi)/5
        x = np.linspace(minx,maxx, 1000)
    
        n = len(data.columns)
    
        if not cmap:
            cmap = plt.cm.get_cmap("Blues")
        colors = cmap(np.linspace(.2,1,n))
    
        fig, axes = plt.subplots(nrows = n, sharex=True)
    
        for c, ax, color in zip(data.columns, axes, colors):
            y = data[c].values
            y = y[~np.isnan(y)]
            kde = gaussian_kde(y)
            ax.fill_between(x, kde(x), color=color)
            ax.yaxis.set_visible(False)
            for spine in ["left", "right", "top"]:
                ax.spines[spine].set_visible(False)
            ax.spines["bottom"].set_linewidth(2)
            ax.spines["bottom"].set_color(color)
            ax.margins(y=0)
            ax.tick_params(bottom=False)
    
        return fig, axes
    

    把它当做

    import pandas as pd
    
    data = pd.DataFrame({'a': np.random.randn(1000) + 1,
                  'b': np.random.randn(1000),
                  'c': np.random.rand(1000) + 10},        
                 columns=['a', 'b', 'c'])
    
    data.a[data.a.sample(100).index] = np.NaN
    data.b[data.b.sample(800).index] = np.NaN
    
    
    joyplot_from_dataframe(data)    
    plt.show()
    

    【讨论】:

    • 如何使用 ax.txt 在每个图例旁边添加一个图例?
    • 使用ax.text
    猜你喜欢
    • 2014-10-09
    • 1970-01-01
    • 2020-03-21
    • 2018-12-17
    • 2023-03-11
    • 2020-01-30
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多