数据挖掘

机器学习实战系列[一]:工业蒸汽量预测(最新版本上篇)含数据探索特征工程等

机器学习实战系列[一]:工业蒸汽量预测(最新版本上篇)含数据探索特征工程等 机器学习实战系列[一]:工业蒸汽量预测 背景介绍 火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉 »

ting1

机器学习算法(九): 基于线性判别模型的LDA手写数字分类识别

机器学习算法(九): 基于线性判别模型的LDA手写数字分类识别 1.机器学习算法(九): 基于线性判别模型的LDA手写数字分类识别 1.1 LDA算法简介和应用 线性判别模型(LDA)在模式识别领域(比如人脸识别等图形图像识别领域)中有非常广泛的应用。LDA是一种监督学习的降维技术, »

ting1

机器学习算法(八):基于BP神经网络的乳腺癌的分类预测

BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则 »

ting1

器学习算法(六)基于天气数据集的XGBoost分类预测

器学习算法(六)基于天气数据集的XGBoost分类预测 1.机器学习算法(六)基于天气数据集的XGBoost分类预测 1.1 XGBoost的介绍与应用 XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可 »

ting1

器学习算法(六)基于天气数据集的XGBoost分类预测

器学习算法(六)基于天气数据集的XGBoost分类预测 1.机器学习算法(六)基于天气数据集的XGBoost分类预测 1.1 XGBoost的介绍与应用 XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可 »

ting1

机器学习算法(五):基于企鹅数据集的决策树分类预测

决策树的主要优点: 1. 具有很好的解释性,模型可以生成可以理解的规则。 2. 可以发现特征的重要程度。 3. 模型的计算复杂度较低。 决策树的主要缺点: 1. 模型容易过拟合,需要采用减枝技术处理。 2. 不能很好利用连续型特征。 3. 预测能力有限,无法达到其他强监督模型效果。 4. 方差 »

ting1

机器学习算法(五):基于企鹅数据集的决策树分类预测

决策树的主要优点: 1. 具有很好的解释性,模型可以生成可以理解的规则。 2. 可以发现特征的重要程度。 3. 模型的计算复杂度较低。 决策树的主要缺点: 1. 模型容易过拟合,需要采用减枝技术处理。 2. 不能很好利用连续型特征。 3. 预测能力有限,无法达到其他强监督模型效果。 4. 方差 »

ting1

机器学习算法(二): 基于鸢尾花数据集的朴素贝叶斯(Naive Bayes)预测分类

优点: 朴素贝叶斯算法主要基于经典的贝叶斯公式进行推倒,具有很好的数学原理。而且在数据量很小的时候表现良好,数据量很大的时候也可以进行增量计算。由于朴素贝叶斯使用先验概率估计后验概率具有很好的模型的可解释性。 缺点: 朴素贝叶斯模型与其他分类方法相比具有最小的理论误差率。但是实际上并非总是如此,这 »

ting1

机器学习算法(一): 基于逻辑回归的分类预测

逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。 机器学习算法(一): 基于逻辑回归的 »

ting1

机器学习算法(一): 基于逻辑回归的分类预测

逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。 机器学习算法(一): 基于逻辑回归的 »

ting1

用Python绘图(数据分析与挖掘实战)

代码1:餐饮日销额数据异常值检测(箱型图) import pandas as pd import numpy as np catering_sale = "D:\360MoveData\Users\86130\Documents\Tencent Files\2268756693\Fi »

zsn2268756693----

数据挖掘原理与应用期末考试复习

1 绪论 数据挖掘定义 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘是从数据中提取信息和知识的过程。 *数据分类和数据聚类的概念如何区别? 分类是我知道A校校服是红色的,B校校服是蓝色的,那么一个穿着蓝色 ... »

数据挖掘三大模块

目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ »

数据挖掘中如何处理缺失数据

目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ »