【发布时间】:2016-12-10 05:08:07
【问题描述】:
我有一个计数表作为 Python 中的数据框,我想将我的分布绘制为箱线图。例如:
df=pandas.DataFrame.from_items([('Quality',[29,30,31,32,33,34,35,36,37,38,39,40]), ('Count', [3,38,512,2646,9523,23151,43140,69250,107597,179374,840596,38243])])
我通过按计数重复我的质量值来“解决”它。但我认为这不是一个好方法,而且我的数据框变得非常非常大。
在 R 中,它只有一个衬里:
ggplot(df, aes(x=1,y=Quality,weight=Count)) + geom_boxplot()
这将输出:!Boxplot from R1
【问题讨论】:
-
看起来python有一个
ggplot接口,也许同样的语法可以工作:ggplot.yhathq.com -
我更新了我的问题并添加了 R 的情节。它现在看起来不太好,但这只是一个例子。我已经看过 ggplot,但我想避免使用很多不同的包。我认为 pandas 和 matplotlib 非常强大,我想知道为什么在这些包中不可能......
-
python生成的
boxplot和R得到的一样吗?我的意思是情节必须与您为给定数据发布的图像相同吗? -
如果我在 python 中绘制计数表并假设我的列是独立的。所以它返回一个用于计数和质量的箱线图,这对我来说没有意义。
标签: python python-3.x pandas matplotlib ggplot2