【问题标题】:Pandas count results per unique serverPandas 计算每个唯一服务器的结果
【发布时间】:2015-06-26 23:39:25
【问题描述】:

我对 pandas 和 python 都很陌生。我确实找到了这个

Pandas Count Unique Occurances by Month

在与我的问题类似的 stackoverflow 上,但我似乎无法操纵答案来解决我的问题,所以这里是:

我有一个服务器列表,每个服务器都有许多适用于该服务器的补丁。 excel看起来有点像这样:

Server Name - Missing Patch
Server 1 ---- file
Server 1 ---- reg
Server 1 ---- file
Server 2 ---- reg
Server 2 ---- file
Server 2 ---- file
Server 2 ---- file
Server 3 ---- reg
Server 3 ---- reg
Server 3 ---- file
Server 3 ---- reg
Server 3 ---- unicorns

我想制作一个数据框,其中包含一列唯一服务器和一列计算每台服务器缺少多少补丁。它应该是这样的:

Server Name - Missing Patch Count
Server 1 ---- 3
Server 2 ---- 4
Server 3 ---- 5

我似乎无法使 nunique 工作,并且 value_counts 返回一个系列,这不是我想要的。我设法让df.drop_duplicates('Server Name') 只显示服务器名称的唯一实例,但我无法让它按该数据对列进行排序。

我意识到这里有很多类似的问题,但我是 pandas 的新手,似乎无法使用文档将正确的语法应用于我的问题 - 谁能帮忙?

【问题讨论】:

  • Arrgh - 'Server Name' 是一个包含服务器名称的列,'Missing Patch' 和 'Missing Patch Count' 也是列 - 我无法上传图片因为我我是论坛的新手,我的 html 很烂,抱歉

标签: python pandas group-by dataframe


【解决方案1】:

您可以groupby'Server Name',调用count然后reset_index恢复服务器名称栏:

In [330]:

df.groupby('Server Name').count().reset_index()
Out[330]:
  Server Name  Missing Patch
0    Server 1              3
1    Server 2              4
2    Server 3              5

【讨论】:

  • 如果我的回答解决了你的问题,你可以接受,我的回答左上角的投票按钮下方会有一个空的勾号
  • 啊好吧 - 抱歉我对 stackoverflow 很陌生
猜你喜欢
  • 2021-06-19
  • 1970-01-01
  • 2016-11-13
  • 2020-10-06
相关资源
最近更新 更多