Python pandas
1.导入pandas模块
2.读取.csv文件
3.输出变量类型,返回为dataframe类型数据
4.输出dataframe中各列数据类型
1.——.head()无参数时,默认显示前5行数据,——.tail()为显示尾几行数据
2.——.columns 返回最上一行的默认列索引值
3.——.shape 返回数据行数列数
1.——.loc[0] 取第0行数据,也可以.loc[1:3]取第1行到第3行的数据,也可以.loc[2,4]取第2行和第4行的数据
2.——.loc[超出数据内的范围] 则会报错
在读取.csv文件时,会默认第一行为列名,格式为字符串,可以直接作为索引(需加双引号),若想索引两个列,可将两个列名作为列表传给一个变量,然后索引变量
1.——.columns 列名 ——.tolist() 变成列表变量 ——.endswith() 以某一数值结尾
2.找出所有"(g)"结尾的列
1.对整列数值进行运算,相当于列中每个值进行了相同的运算
2.两列之间的数值计算,若维数相同,则为对应位置数据之间进行的计算