一.Pandas

1.Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,主要用于数据处理(数据整理,操作,存储,读取等)

2.http://pandas.pydata.org/

3.pandas中的数据结构:

Series一维数组,只允许存储相同的数据类型;

Time- Series:以时间为索引的Series;

DataFrame:二维的表格型数据结构;

Panel :三维的数组,可以理解为DataFrame的容器

 

 

 二.创建表格

1.Series创建一维标记数据表格,相似于ndarry,但有索引(从0开始)(表格的列的列表)

__init__(self, data=None, index=None, dtype=None, name=None,copy=False, fastpath=False)

一般形式:s = pd.Series(data, index=index) #data可以是一个字典,一个ndarray,或标量值(5)

(1)ndarray

 1 #ndarry,若设置索引,则索引的长度必须与数据的长度相同,
 2 s = pd.Series(np.random.randn(5), index=['a', 'b', 'c', 'd', 'e'])
 3 s2=pd.Series(np.random.randn(5))#如果没有传递索引,将创建一个具有值的索引。[0, ..., len(data) - 1]
 4 print(s)
 5 print(s2)
 6 -------------------------------------------
 7 a   -0.019921
 8 b   -2.324644
 9 c   -0.429393
10 d    1.436731
11 e    2.564406
12 dtype: float64
13 0   -0.925714
14 1    0.319075
15 2    0.528071
16 3   -0.385841
17 4    0.963207
18 dtype: float64
ndarray

相关文章: