【发布时间】:2015-03-23 19:47:18
【问题描述】:
我有一组信息,我想获取 TOP 10 值而不是其他所有值。为了详细说明,我想将所有不在前 10 名中的值加在一起,并将它们添加到一个标记为“其他”的饼图以及前 10 名中。目前我有以下代码,其中 X 是我的数据框:
temp = X.SOME_IDENTIFIER.value_counts()
temp.head(10).plot(kind='pie')
这为我提供了一个仅包含前十名的饼图,但我不希望丢弃数据框中的所有其他值。我想将它们添加为图表上的第十一个变量,但不确定如何执行此操作。感谢您提供任何帮助或建议。
【问题讨论】:
-
你能发布一个例子或者让你想要的更清楚吗?这个“信息”是什么?它以什么格式出现?
-
当然,让我试着解释得更好。我有一个数据框,其中一列是名称,所以它是字符串类型。这些名称中的大多数出现多次(数千次),而其他名称出现的次数则少得多。对于出现最多的十个名称,我想在饼图中将它们显示为单独的名称。对于不在前十名频率中的所有其他名称,我想将它们的出现次数组合在一起,并命名为“其他”。然后我可以在与前十名相同的条形图中绘制这个“其他组”。有点像查看前十名与其他人相比发生了多少的方法。
标签: python python-2.7 pandas