机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)含特征优化模型融合等
工业蒸汽量预测(最新版本下篇) 5.模型验证 5.1模型评估的概念与正则化 5.1.1 过拟合与欠拟合 ### 获取并绘制数据集 import numpy as np import matplotlib.pyplot as plt %matplotlib inline np.random.seed »
工业蒸汽量预测(最新版本下篇) 5.模型验证 5.1模型评估的概念与正则化 5.1.1 过拟合与欠拟合 ### 获取并绘制数据集 import numpy as np import matplotlib.pyplot as plt %matplotlib inline np.random.seed »
工业蒸汽量预测(最新版本下篇) 5.模型验证 5.1模型评估的概念与正则化 5.1.1 过拟合与欠拟合 ### 获取并绘制数据集 import numpy as np import matplotlib.pyplot as plt %matplotlib inline np.random.seed »
机器学习实战系列[一]:工业蒸汽量预测(最新版本上篇)含数据探索特征工程等 机器学习实战系列[一]:工业蒸汽量预测 背景介绍 火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉 »
机器学习算法(九): 基于线性判别模型的LDA手写数字分类识别 1.机器学习算法(九): 基于线性判别模型的LDA手写数字分类识别 1.1 LDA算法简介和应用 线性判别模型(LDA)在模式识别领域(比如人脸识别等图形图像识别领域)中有非常广泛的应用。LDA是一种监督学习的降维技术, »
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则 »
机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测 1. 机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测 1.1 LightGBM原理简介 LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,它 »
机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测 1. 机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测 1.1 LightGBM原理简介 LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,它 »
器学习算法(六)基于天气数据集的XGBoost分类预测 1.机器学习算法(六)基于天气数据集的XGBoost分类预测 1.1 XGBoost的介绍与应用 XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可 »
器学习算法(六)基于天气数据集的XGBoost分类预测 1.机器学习算法(六)基于天气数据集的XGBoost分类预测 1.1 XGBoost的介绍与应用 XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可 »
决策树的主要优点: 1. 具有很好的解释性,模型可以生成可以理解的规则。 2. 可以发现特征的重要程度。 3. 模型的计算复杂度较低。 决策树的主要缺点: 1. 模型容易过拟合,需要采用减枝技术处理。 2. 不能很好利用连续型特征。 3. 预测能力有限,无法达到其他强监督模型效果。 4. 方差 »
决策树的主要优点: 1. 具有很好的解释性,模型可以生成可以理解的规则。 2. 可以发现特征的重要程度。 3. 模型的计算复杂度较低。 决策树的主要缺点: 1. 模型容易过拟合,需要采用减枝技术处理。 2. 不能很好利用连续型特征。 3. 预测能力有限,无法达到其他强监督模型效果。 4. 方差 »
优点: 朴素贝叶斯算法主要基于经典的贝叶斯公式进行推倒,具有很好的数学原理。而且在数据量很小的时候表现良好,数据量很大的时候也可以进行增量计算。由于朴素贝叶斯使用先验概率估计后验概率具有很好的模型的可解释性。 缺点: 朴素贝叶斯模型与其他分类方法相比具有最小的理论误差率。但是实际上并非总是如此,这 »
逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。 机器学习算法(一): 基于逻辑回归的 »
逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。 机器学习算法(一): 基于逻辑回归的 »
代码1:餐饮日销额数据异常值检测(箱型图) import pandas as pd import numpy as np catering_sale = "D:\360MoveData\Users\86130\Documents\Tencent Files\2268756693\Fi »
快速入门pandas进行数据挖掘数据分析[多维度排序、数据筛选、分组计算、透视表](一) 1. 快速入门python,python基本语法 Python使用缩进(tab或者空格)来组织代码,而不是像其 他语言比如R、C++、Java和Perl那样用大括号。考虑使用for循 环来实现排序 »
1 绪论 数据挖掘定义 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘是从数据中提取信息和知识的过程。 *数据分类和数据聚类的概念如何区别? 分类是我知道A校校服是红色的,B校校服是蓝色的,那么一个穿着蓝色 ... »
本文使用 Kaggle 数据集创建了一个Demo,演示如何使用 Python 调用 ipywidget 模块,快速创建交互式仪表板。快用起来吧~ ... »
目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ »
目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ »