【发布时间】:2019-04-19 16:54:01
【问题描述】:
我有一个数据集,其中包含棒球运动员的所有击球率。我将这个数据集中的每个玩家随机分配到一个集群中。现在我想在堆叠直方图中直观地显示每个集群。我使用以下内容:
import matplotlib.pyplot as plt
def chart(k=2):
x = np.arange(0, 0.4, 0.001)
for j in range(k):
cluster = df.loc[df['cluster'] == j].reset_index()
plt.hist(cluster['Average'], bins=50, density=1, stacked=True)
plt.xlim(0, 0.4)
plt.xlabel('Batting Average')
plt.ylabel('Density')
plt.show()
但是,我希望看到以下内容:
我通过划分“硬编码”数据集来创建此图表。理想情况下,我想通过创建一个循环来动态地做到这一点。我怎样才能添加一个带有集群名称的图例并为每个集群指定颜色?再次循环。 K 例如也可以是 10。 提前致谢
【问题讨论】:
标签: python matplotlib histogram