记录一下之前没学到的功能
-
pandas 根据数据类型选择列
df.select_dtypes(include=[‘number’]).head() #参数include指定数据类型
df.select_dtypes(include=[‘float’]).head() -
nunique显示有多少个唯一值、unique显示所有的唯一值
df[‘Physics’].nunique()
df[‘Physics’].unique() -
count和value_counts
count返回非缺失值元素个数,value_counts返回每个元素有多少个
df[‘Physics’].count()
df[‘Physics’].value_counts() -
idxmax和nlargest
idxmax获取最大值的索引值
nlargest获取指定列的前几个最大的值及行号
df[‘Math’].idxmax()
df[‘Math’].nlargest(3) -
clip和replace是两类替换函数
clip是对超过或者低于某些值的数进行截断
replace是对某些值进行替换
df[‘Math’].clip(33,80).head()
df[‘Address’].replace([‘street_1’,‘street_2’],[‘one’,‘two’]).head() -
map、apply、applymap的区别
map作用于series,DataFrame结构中没有map
apply作用于DataFrame中的每个行或者列
applymap作用于DataFrame中的所有元素