-
pymysql学习,这部分有单独写过一篇博文。pymysql学习
-
dataframe[“列名”].unique()
以数组形式返回列的所有唯一值 -
文本预处理可能用到的函数:
-
dataframe[“列名”].value_counts()
返回一组唯一值,并进行计数 -
dataframe.loc[布尔数组]
返回dataframe中的行 -
dataframe.isnull()
若某处为缺失值,则返回True -
pd.to_datetime(df[“列名”],
unit = " ") #可取s,ms,us,ns
获取指定的日期,可用于将时间戳转为日期类型 -
df[“列名”].dt.date
返回日期数组 -
pd.Timedelta(days= ,
minutes= ,
seconds= )
可以直接通过+或-实现datetime加减 -
pd.Timestamp()
定义时间戳,代表时间点 -
df.duplicated()
返回布尔值Series,反映每一行是否存在重复
df.drop_duplicates()
返回的是DataFrame,内容是duplicated返回数组中为False的部分。 -
df.groupby(df[“列名”])
根据df的某一列内容进行分组聚合 -
df. sort_index()
根据行标签对所有行进行排序
相关文章: