【发布时间】:2014-10-06 16:28:08
【问题描述】:
我有一个数据框,其中一些列包含数字数据和其他包含文本。这基本上是它的样子:
Age Weight Blood Sugar Study Group Gender Notes
29 195 126 B Female notes of some kind
34 180 140 B Male different set of notes
48 220 111 C Male blah blah
55 189 109 C Male some more notes
我想根据数值数据列的排名创建数据框的细分。例如,如果我需要 2 个最老的患者,我的新数据框将如下所示:
Age Weight Blood Sugar Study Group Gender Notes
48 220 111 C Male blah blah
55 189 109 C Male some more notes
rank 函数看起来很有用。我想我可以跑:
df2 = rank.df(axis=0)
然后找到一些方法来使用 df2 的索引将行从 df 拉到新的数据帧中。大致如下:
cutoff = df2[df2 > 10]
# DELETE ROWS WITH NaN VALUES IN THE COLUMNS OF INTEREST
这感觉有点笨拙。我希望有更直接的说法,
“熊猫,我想要一个新的数据框,其中包含 15 个最年长的人。太好了!现在我想要一个包含 20 个最年轻的人的新数据框,等等”
【问题讨论】: