【发布时间】:2015-06-26 23:39:25
【问题描述】:
我对 pandas 和 python 都很陌生。我确实找到了这个
Pandas Count Unique Occurances by Month
在与我的问题类似的 stackoverflow 上,但我似乎无法操纵答案来解决我的问题,所以这里是:
我有一个服务器列表,每个服务器都有许多适用于该服务器的补丁。 excel看起来有点像这样:
Server Name - Missing Patch
Server 1 ---- file
Server 1 ---- reg
Server 1 ---- file
Server 2 ---- reg
Server 2 ---- file
Server 2 ---- file
Server 2 ---- file
Server 3 ---- reg
Server 3 ---- reg
Server 3 ---- file
Server 3 ---- reg
Server 3 ---- unicorns
我想制作一个数据框,其中包含一列唯一服务器和一列计算每台服务器缺少多少补丁。它应该是这样的:
Server Name - Missing Patch Count
Server 1 ---- 3
Server 2 ---- 4
Server 3 ---- 5
我似乎无法使 nunique 工作,并且 value_counts 返回一个系列,这不是我想要的。我设法让df.drop_duplicates('Server Name') 只显示服务器名称的唯一实例,但我无法让它按该数据对列进行排序。
我意识到这里有很多类似的问题,但我是 pandas 的新手,似乎无法使用文档将正确的语法应用于我的问题 - 谁能帮忙?
【问题讨论】:
-
Arrgh - 'Server Name' 是一个包含服务器名称的列,'Missing Patch' 和 'Missing Patch Count' 也是列 - 我无法上传图片因为我我是论坛的新手,我的 html 很烂,抱歉
标签: python pandas group-by dataframe