pandas库

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

导入pandas库
十分钟入门Pandas(python)
Pandas 库里有两个常用数据对象:Series 和DataFrame

创建对象

我们先看下创建DataFrame的动作
十分钟入门Pandas(python)
我们再来看看pd.DataFrame 的一些默认值
十分钟入门Pandas(python)
还可用字典来创建
十分钟入门Pandas(python)
创建一个Series
十分钟入门Pandas(python)

内置的一些方法

先创建一个DataFrame
十分钟入门Pandas(python)
列的名字
十分钟入门Pandas(python)
所有的值
十分钟入门Pandas(python)
总体的看下数据
十分钟入门Pandas(python)
按照纵坐标排序,或者横坐标排序,axis=1 则是横坐标,反之
十分钟入门Pandas(python)
索引,定位
先创一个DataFrame
十分钟入门Pandas(python)
可以单独看看A列
十分钟入门Pandas(python)
使用索引值
十分钟入门Pandas(python)
**

用loc函数

**

十分钟入门Pandas(python)
很强大,很方便的loc
十分钟入门Pandas(python)
查询起来很方便
十分钟入门Pandas(python)
总之loc函数是通过横纵坐标的具体值来定位

再看看通过索引定位的iloc
十分钟入门Pandas(python)
额。。。这个还有混合的,也就是索引和值混合用!太猛了!
十分钟入门Pandas(python)
还能做条件定位
十分钟入门Pandas(python)
改齐其中的值
十分钟入门Pandas(python)
十分钟入门Pandas(python)

数据清洗

当表格中有nan的情况:
十分钟入门Pandas(python)
删掉nan
十分钟入门Pandas(python)
把所有的nan变为你想要的值
十分钟入门Pandas(python)
如果数据量过大,可以直接查询有没有数据丢失
十分钟入门Pandas(python)

导入导出

导入导出的放法,用变量名接住就行
十分钟入门Pandas(python)

数据合并

先看三列数据
十分钟入门Pandas(python)

学了上面的应该知道他们现在的样子吧
十分钟入门Pandas(python)
合并(当列相同的情况下)
十分钟入门Pandas(python)
合并(当列不相同的情况下)
十分钟入门Pandas(python)
DataFrame 合并Series
十分钟入门Pandas(python)

有关联的数据块合并:
十分钟入门Pandas(python)
十分钟入门Pandas(python)
==合并》
十分钟入门Pandas(python)
通过两个关联项合并
十分钟入门Pandas(python)
十分钟入门Pandas(python)

==合并》
十分钟入门Pandas(python)
看看上面的haw ,可以灵活的合并出你想要的结果

合并之后如何快速查看数据呢?
先创建两个数据项
十分钟入门Pandas(python)
十分钟入门Pandas(python)
十分钟入门Pandas(python)
如果你没有用jupyter那么你会需要下面这个函数
先创建数据
十分钟入门Pandas(python)
十分钟入门Pandas(python)
OK

相关文章: