一.Pandas
1.Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,主要用于数据处理(数据整理,操作,存储,读取等)
2.http://pandas.pydata.org/
3.pandas中的数据结构:
Series一维数组,只允许存储相同的数据类型;
Time- Series:以时间为索引的Series;
DataFrame:二维的表格型数据结构;
Panel :三维的数组,可以理解为DataFrame的容器
二.创建表格
1.Series创建一维标记数据表格,相似于ndarry,但有索引(从0开始)(表格的列的列表)
__init__(self, data=None, index=None, dtype=None, name=None,copy=False, fastpath=False)
一般形式:s = pd.Series(data, index=index) #data可以是一个字典,一个ndarray,或标量值(5)
(1)ndarray
1 #ndarry,若设置索引,则索引的长度必须与数据的长度相同, 2 s = pd.Series(np.random.randn(5), index=['a', 'b', 'c', 'd', 'e']) 3 s2=pd.Series(np.random.randn(5))#如果没有传递索引,将创建一个具有值的索引。[0, ..., len(data) - 1] 4 print(s) 5 print(s2) 6 ------------------------------------------- 7 a -0.019921 8 b -2.324644 9 c -0.429393 10 d 1.436731 11 e 2.564406 12 dtype: float64 13 0 -0.925714 14 1 0.319075 15 2 0.528071 16 3 -0.385841 17 4 0.963207 18 dtype: float64