【发布时间】:2021-03-16 14:11:54
【问题描述】:
我有以下数据框:
fruits={'fruit':['apple1','apple2','banana1','banan2','peach1','peach2'],'1':[0,0,0,1,0,1],'2':[1,1,0,1,1,1],'3':[1,1,1,1,0,0],'4':[0,1,1,1,1,1]}
df_fruits=pd.DataFrame(data=fruits)
df_fruits=df_fruits.set_index('fruit')
>>> 1 2 3 4
fruit
apple1 0 1 1 0
apple2 0 1 1 1
banana1 0 0 1 1
banan2 1 1 1 1
peach1 0 1 0 1
peach2 1 1 0 1
我正在尝试创建某种热图,因此如果值为 1,它将获得颜色,如果值为 0,则会获得灰色。除此之外,这是问题所在,我想给所有的水果第一颜色蓝色和所有第二颜色绿色的水果。 我曾尝试使用here 中提到的脚本,但我在不想要的位置的单元格上得到白线,将每一行分成两行:
N_communities = df_fruits.index.size
N_cols = df_fruits.columns.size
cmaps = ['Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens','Blues','Greens']
fig, ax = plt.subplots(figsize=(10,8))
for i,((idx,row),cmap) in enumerate(zip(df_fruits.iterrows(), cmaps)):
ax.imshow(np.vstack([row.values, row.values]), aspect='equal', extent=[-0.5,N_cols-0.5,i,i+1], cmap=cmap)
for j,val in enumerate(row.values):
vmin, vmax = row.agg(['min','max'])
vmid = (vmax-vmin)/2
#if not np.isnan(val):
#ax.annotate(val, xy=(j,i+0.5), ha='center', va='center', color='black' if (val<=vmid or vmin==vmax) else 'white')
ax.set_ylim(0,N_communities)
ax.set_xticks(range(N_cols))
ax.set_xticklabels(df_fruits.columns, rotation=90, ha='center')
ax.set_yticks(0.5+np.arange(N_communities))
ax.set_yticklabels(df_fruits.index)
ax.set_ylabel('Index')
ax.hlines([2,4],color="black" ,*ax.get_xlim())
ax.invert_yaxis()
fig.tight_layout()
如您所见,看起来苹果 1 有两行,苹果 2 有两行,依此类推,而我希望每个都有一行。 我尝试过使用范围,但无法摆脱这些线条。
我的最终目标 - 在热图中为数据框中的每一行保留一行,当以 1 结尾的水果为蓝色时,以 2 结尾的水果为绿色(仅当值为 1 时)。如果值为零,它将是灰色的。
编辑: 我按照建议使用了 ax.grid(False) 但仍然不好,因为线条消失了。我还发现绘图是错误的:
如您所见,“banana2”行假设为绿色但为白色。
【问题讨论】:
-
ax.grid(False)? -
@DavidG 我想要网格,但在正确的方式上,这会取消所有网格线
标签: python matplotlib heatmap