1、to_numeric
在转换数据类型时,会忽略 NaN ,而 astype 则在数据中存在 NaN 时报错,无法转换成功
2、用 cut 函数分箱
cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
备注:x 为被切对象,是个一维的类数组结构,bins 参数可以是序列、整数或标量
当 bins 为整数时,它代表的意思是等宽的箱子个数
备注1:bins 的元素必须是唯一的
3、当使用 *_index 作为连接键时,连接后的 df 的索引可能会是乱序的
4、df.join([list1, list2, ..., listn])
该方法可以将多个 df 合并
5、concat 函数
备注:
①concat 函数既可以合并 Series 也可以合并 df
②默认纵向连接
6、np.where 方法可以用来用作两个 Series 间的数据的满足条件的替换, 如:
np.where(pd.isnull(a), b, a)
第一个参数:condition, 条件
第二个参数:既可以是二维数组也可以是一维的 Series
第三个参数:同第二个参数
该函数是当 b 在条件为 False 时,用 a 的值来填充
7、想要获取某个 datetime 格式的 Series 的年月日时,可以通过如下方法获得
print tmp1.dt.year
print tmp1.dt.month
print tmp1.dt.day
8、当 Series 的值中存在有空值 NaN 时,值的数据类型不能是整数,可以是浮点数、字符串