【问题标题】:Compare two distributions with different sizes using Python使用 Python 比较两个不同大小的分布
【发布时间】:2017-01-03 08:09:24
【问题描述】:

我想比较两个不同的分布,一个有 100 个数据点,另一个有 150 个数据点。

seaborn 中,我可以通过这种方式使用lmplot 做到这一点:

import pandas as pd
import seaborn as sns

df = pd.DataFrame(data)
sns.lmplot(x="dist1", y="dist2", data=df)

考虑到输入 pandas DataFrame 由两列 dist1dist2 组成,每一列具有相同数量的数据点。

但是,这只适用于相同大小的分布。因此,我正在考虑采用每个分布的百分位数。 是否已经实现了这样的情节(例如在 matplotlib、seaborn、statsmodels、plotly..)?

编辑

关于结束投票:这个问题不属于CrossValidated SE,因为我显然是在询问代码或库 API 来比较两个分布,而不是关于分布或分析它们的统计方法的理论问题。这里我的意思是分布:一组数据点。

【问题讨论】:

    标签: python matplotlib distribution seaborn percentile


    【解决方案1】:

    假设希望两个数据集在同一轴上,请参阅this。您需要对要绘制的轴的引用。

    样本:

    a = [1.1, 2.8, 14, 21, 23]
    b = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    
    fig, ax1 = plt.subplots()
    ax1.scatter(range(len(a)), a)
    ax1.scatter(range(len(b)), b)
    

    【讨论】:

      猜你喜欢
      • 2021-09-11
      • 2019-04-20
      • 1970-01-01
      • 1970-01-01
      • 2016-02-24
      • 1970-01-01
      • 1970-01-01
      • 2017-12-14
      • 2022-01-11
      相关资源
      最近更新 更多