1. pymysql学习,这部分有单独写过一篇博文。pymysql学习

  2. dataframe[“列名”].unique()
    以数组形式返回列的所有唯一值

  3. 文本预处理可能用到的函数:近期学习总结

  4. dataframe[“列名”].value_counts()
    返回一组唯一值,并进行计数
    近期学习总结

  5. dataframe.loc[布尔数组]
    返回dataframe中的行

  6. dataframe.isnull()
    若某处为缺失值,则返回True

  7. pd.to_datetime(df[“列名”],
    unit = " ") #可取s,ms,us,ns
    获取指定的日期,可用于将时间戳转为日期类型

  8. df[“列名”].dt.date
    返回日期数组

  9. pd.Timedelta(days= ,
    minutes= ,
    seconds= )
    可以直接通过+或-实现datetime加减

  10. pd.Timestamp()
    定义时间戳,代表时间点

  11. df.duplicated()
    返回布尔值Series,反映每一行是否存在重复
    df.drop_duplicates()
    返回的是DataFrame,内容是duplicated返回数组中为False的部分。

  12. df.groupby(df[“列名”])
    根据df的某一列内容进行分组聚合

  13. df. sort_index()
    根据行标签对所有行进行排序

相关文章: