滤除缺失数据
过滤掉缺失数据的办法有很多种。你可以通过pandas.isnull或布尔索引的手工方 法,但dropna可能会更实用一些。对于一个Series,dropna返回一个仅含非空数据 和索引值的Series
=====================================
等价于
=====================================
对于DataFrame对象,事情就有点复杂了。你可能希望丢弃全NA或含有NA的行 或列。dropna默认丢弃任何含有缺失值的行
=====================================
传入how='all’将只丢弃全为NA的那些行
=====================================
用这种方式丢弃列,只需传入axis=1即可
=====================================
另一个滤除DataFrame行的问题涉及时间序列数据。假设你只想留下一部分观测数 据,可以用thresh参数实现此目的
填充缺失数据
通过一 个常数调用fillna就会将缺失值替换为那个常数值
=====================================
通过一个字典调用fillna,就可以实现对不同的列填充不同的值
=====================================
fillna默认会返回新对象,但也可以对现有对象进行就地修改
=====================================
对reindexing有效的那些插值方法也可用于fillna
=====================================
可以利用fillna实现许多别的功能。可以传入Series 的平均值或中位数
++++++++++++++++++++++++++++++++++++
下一篇:pandas入门(十)