pandas模块

更高级的数据分析工具
基于NumPy构建
包含Series和DataFrame两种数据结构,以及相应方法
调用方法:
from pandas import  Series, DataFrame
import pandas as pd
Series
又像数组又像字典:
有序
通常是同构的
元素采用NumPy中的数据类型
既以按键索引,又可以按序号索引
默认创建:
Python———pandas数据处理
 
以字典形式创建
Python———pandas数据处理

以常规形式创建

Python———pandas数据处理

 

Series算术运算中按照键来对齐

NaN和数字做运算,得NaN

Python———pandas数据处理

 

 

DataFrame

很像一个Excel表格
含有一组有序的列
列内(应该)同构,列之间可以是不同的数据类型
既有列索引,也有行索引
以二维结构保存数据(高维数据视作二维表格的叠加)
 
Python———pandas数据处理

改名?增加列

Python———pandas数据处理

 

按列读取、、按行读取

Python———pandas数据处理

 按行、列索引

Python———pandas数据处理

 

 丢弃指定行、列

Python———pandas数据处理

 插入列

Python———pandas数据处理

过滤

 

Python———pandas数据处理

按索引排序

Python———pandas数据处理

 

 

Python———pandas数据处理

 

Python———pandas数据处理

 

 

相关文章: