【问题标题】:Use two colors to color different rows in seaborn heatmap split the rows into two使用两种颜色为 seaborn 热图中的不同行着色
【发布时间】:2021-03-16 14:11:54
【问题描述】:

我有以下数据框:

fruits={'fruit':['apple1','apple2','banana1','banan2','peach1','peach2'],'1':[0,0,0,1,0,1],'2':[1,1,0,1,1,1],'3':[1,1,1,1,0,0],'4':[0,1,1,1,1,1]}
df_fruits=pd.DataFrame(data=fruits)
df_fruits=df_fruits.set_index('fruit')


>>>     1   2   3   4
fruit               
apple1  0   1   1   0
apple2  0   1   1   1
banana1 0   0   1   1
banan2  1   1   1   1
peach1  0   1   0   1
peach2  1   1   0   1

我正在尝试创建某种热图,因此如果值为 1,它将获得颜色,如果值为 0,则会获得灰色。除此之外,这是问题所在,我想给所有的水果第一颜色蓝色和所有第二颜色绿色的水果。 我曾尝试使用here 中提到的脚本,但我在不想要的位置的单元格上得到白线,将每一行分成两行:

N_communities = df_fruits.index.size
N_cols = df_fruits.columns.size
cmaps = ['Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens']

fig, ax = plt.subplots(figsize=(10,8))

for i,((idx,row),cmap) in enumerate(zip(df_fruits.iterrows(), cmaps)):
    ax.imshow(np.vstack([row.values, row.values]), aspect='equal', extent=[-0.5,N_cols-0.5,i,i+1], cmap=cmap)
    for j,val in enumerate(row.values):
        vmin, vmax = row.agg(['min','max'])
        vmid = (vmax-vmin)/2
        #if not np.isnan(val):
            #ax.annotate(val, xy=(j,i+0.5), ha='center', va='center', color='black' if (val<=vmid or vmin==vmax) else 'white')
ax.set_ylim(0,N_communities)

ax.set_xticks(range(N_cols))
ax.set_xticklabels(df_fruits.columns, rotation=90, ha='center')

ax.set_yticks(0.5+np.arange(N_communities))
ax.set_yticklabels(df_fruits.index)
ax.set_ylabel('Index')
ax.hlines([2,4],color="black" ,*ax.get_xlim())
ax.invert_yaxis()

fig.tight_layout()

如您所见,看起来苹果 1 有两行,苹果 2 有两行,依此类推,而我希望每个都有一行。 我尝试过使用范围,但无法摆脱这些线条。

我的最终目标 - 在热图中为数据框中的每一行保留一行,当以 1 结尾的水果为蓝色时,以 2 结尾的水果为绿色(仅当值为 1 时)。如果值为零,它将是灰色的。

编辑: 我按照建议使用了 ax.grid(False) 但仍然不好,因为线条消失了。我还发现绘图是错误的:

如您所见,“banana2”行假设为绿色但为白色。

【问题讨论】:

  • ax.grid(False)?
  • @DavidG 我想要网格,但在正确的方式上,这会取消所有网格线

标签: python matplotlib heatmap


【解决方案1】:

您可以使用sns.heatmapmask 选项:

mask:如果通过,数据将不会显示在maskTrue 的单元格中。具有缺失值的单元格会被自动屏蔽。

所以,要绘制蓝色的fruit1 方块,mask 会去掉fruit2 的值,反之亦然。

fruit1/fruit2 热图可以通过保存坐标轴句柄 ax 并与 ax=ax 重复使用来绘制在一起:

import pandas as pd
import seaborn as sns

fruits = {'fruit':['apple1','apple2','banana1','banana2','peach1','peach2'],'1':[0,0,0,1,0,1],'2':[1,1,0,1,1,1],'3':[1,1,1,1,0,0],'4':[0,1,1,1,1,1]}
df_fruits = pd.DataFrame(data=fruits)
df_fruits = df_fruits.set_index('fruit')

# *** this line is needed for seaborn 0.10.1 (not needed for 0.11.1) ***
df_fruits = df_fruits.astype('float')

# common settings: linewidths for grid lines, hide colorbar, set square aspect
kwargs = dict(linewidths=1, cbar=False, square=True)

# plot initial gray squares and save heatmap handle as ax
ax = sns.heatmap(df_fruits, cmap='Greys_r', alpha=0.2, **kwargs)

# iterate ending:cmap pairs
cmaps = {'1': 'Blues_r', '2': 'Greens_r'}
for ending, cmap in cmaps.items():
    
    # create mask for given fruit ending
    mask = df_fruits.apply(
        lambda x: x if x.name.endswith(ending) else 0,
        result_type='broadcast',
        axis=1,
    ).eq(0)
    
    # plot masked heatmap on reusable ax
    sns.heatmap(df_fruits, mask=mask, cmap=cmap, ax=ax, **kwargs)

【讨论】:

  • 嘿,我在水果数据框上试过你的脚本,但它没有颜色,只有灰色
  • 如果绘制蒙版热图导致错误的最后一部分:TypeError: Cannot convert fill_value nan to dtype int64.
  • 您是指示例数据框还是您的真实数据?如果您收到示例 df 的错误,可能是版本问题 - 您的 sns.__version__pd.__version__ 是什么?如果它来自你的真实数据,它可以公开吗?如果是这样,那么我可以在那里检查问题。
  • 不,是水果 smple 。 seaborn 0.10.1 版和 pandas 1.1.13 版
  • 好的,我用 seaborn 0.10.1 的修复程序编辑了答案,在顶部转换 .astype('float') 附近只多了一行
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-01-27
  • 2022-12-16
  • 1970-01-01
  • 2018-05-09
  • 1970-01-01
  • 2018-05-07
相关资源
最近更新 更多