数据预处理系列
- 数据预处理 第1篇:探索数据
- 数据预处理 第2篇:数据预处理(缺失值)
- 数据预处理 第3篇:数据预处理(使用插补法处理缺失值)
- 数据预处理 第4篇:数据预处理(sklearn 插补缺失值)
- 数据预处理 第5篇:异常值分析
- 数据预处理 第6篇:数据预处理(标准化、归一化、分类数据编码和离散化)
评估模型的指标
- 评估回归模型的指标:MSE、RMSE、MAE、R2、偏差和方差
- 评估分类模型的指标:召回率、精确率、F1值
- 评估分类模型的指标:ROC/AUC
回归模型系列
- 回归模型 第1篇:线性模型概述
分类模型系列
- 分类模型 第1篇:分类模型概述
Python 基础系列:
- Python 开始:变量、操作符、print()和type()
- Python 数据类型:数值和操作符
- Python 数据类型:布尔类型和None
- Python 数据类型:浮点数
- Python 数据类型:字符串
- Python 数据类型:列表
- Python 数据类型:元组和集合
- Python 数据类型:日期和时间
- Python 数据类型:命名元组
- Python 数据类型:动态类型模型
Python 学习 numpy系列:
- numpy 学习:数据类型和空值
- NumPy 学习:创建数组
- numpy 学习:数组改变形状、副本和view
- NumPy 学习:索引和切片
- NumPy 学习:矢量化和广播
- NumPy 学习:元素的选择,替换,增删,滚动、排序和索引
- Numpy 学习:数组的向量化、apply、栅格、查找
- numpy 学习:通用函数(包含数学函数)
- numpy 学习:数组的拼接、堆叠和拆分
- numpy 学习:数组的查找
- numpy 学习:统计函数和相关性
- numpy 学习:保存和加载
Python 学习 pandas 系列:
R 数据挖掘系列(未完结):
- 数据挖掘 第一篇:聚类分析(划分)
- 数据挖掘 第二篇:基于距离评估数据的相似性和相异性
- 数据挖掘 第三篇:聚类的评估(簇数确定和轮廓系数)和可视化
- 数据挖掘 第四篇:OLS回归分析
- 数据挖掘 第五篇:分类(kNN)
Azure Databricks 系列:
- Databricks 第1篇:初识Databricks,创建工作区、集群和Notebook
- Databricks 第2篇:pyspark.sql 简介
- Databricks 第3篇:pyspark.sql 通过JDBC连接数据库
- Databricks 第4篇:pyspark.sql 分组统计和窗口
- Databricks 第5篇:Databricks文件系统(DBFS)
- Databricks 第6篇:Spark SQL 维护数据库和表
- Databricks 第7篇:管理Secret
- Databricks 第8篇:把Azure Data Lake Storage Gen2 (ADLS Gen 2)挂载到DBFS
- Databricks 第9篇:Spark SQL 基础(标识符、数据类型、NULL语义)
- Databricks 第10篇:Job
- Databricks 第11篇:Spark SQL 查询(行转列、列转行、Lateral View、排序)
- Databricks 第12篇:Notebook 工作流
- Databricks: 有用的代码集锦
SQL Server 审计系列:
参考文档: