【发布时间】:2017-01-03 08:09:24
【问题描述】:
我想比较两个不同的分布,一个有 100 个数据点,另一个有 150 个数据点。
在seaborn 中,我可以通过这种方式使用lmplot 做到这一点:
import pandas as pd
import seaborn as sns
df = pd.DataFrame(data)
sns.lmplot(x="dist1", y="dist2", data=df)
考虑到输入 pandas DataFrame 由两列 dist1 和 dist2 组成,每一列具有相同数量的数据点。
但是,这只适用于相同大小的分布。因此,我正在考虑采用每个分布的百分位数。 是否已经实现了这样的情节(例如在 matplotlib、seaborn、statsmodels、plotly..)?
编辑
关于结束投票:这个问题不属于CrossValidated SE,因为我显然是在询问代码或库 API 来比较两个分布,而不是关于分布或分析它们的统计方法的理论问题。这里我的意思是分布:一组数据点。
【问题讨论】:
标签: python matplotlib distribution seaborn percentile