value_counts函数用于统计dataframe或series中不同数或字符串出现的次数

ascending=True时,按升序排列.

normalize=True时,可计算出不同字符出现的频率,画柱状图统计时可以用到.

 

# trian中标签的比例
label_proportion = train['label'].value_counts(normalize=True).reset_index().sort_values(by=['index'])
#    index     label
# 5      1  0.029851
# 2      2  0.199005
# 0      3  0.298507
# 1      4  0.248756
# 3      5  0.149254
# 4      6  0.074627

 

 

 

df1= DataFrame( {"a":[3,4,5,6,2,3,4,4], "b":[2,4,5,6,5,4,3,4]} )
print(df1)
#dataframe要借助apply来应用value_counts()
print(df1.apply(pd.value_counts))
# map中括号内是series类型,key是a列的数,values是出现的次数
print(df1['a'].map(df1['a'].value_counts()))
print(df1['a'].value_counts()) #加括号时可直接统计出a列每个元素出现的次数

 

   a  b
0  3  2
1  4  4
2  5  5
3  6  6
4  2  5
5  3  4
6  4  3
7  4  4
   a  b
2  1  1
3  2  1
4  3  3
5  1  2
6  1  1
0    2
1    3
2    1
3    1
4    1
5    2
6    3
7    3
Name: a, dtype: int64
输出

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-10-12
  • 2022-12-23
  • 2021-08-18
  • 2021-11-04
  • 2021-11-05
  • 2021-11-13
猜你喜欢
  • 2021-12-13
  • 2022-12-23
  • 2021-09-08
  • 2022-12-23
  • 2022-12-23
  • 2021-11-21
  • 2021-12-02
相关资源
相似解决方案