https://docs.microsoft.com/zh-cn/azure/machine-learning/studio/data-science-for-beginners-the-5-questions-data-science-answers

数据科学知识的广博令人生畏,因此这里只简单介绍一些基础知识,不会涉及任何公式或计算机编程专业术语。

我们将讨论“5 个数据科学可解答的问题”。
数据科学使用数字和名称(也称为类别或标签)预测问题的答案。
这可能会让人感到惊讶,但数据科学只可解答以下五种问题:

  • 这是 A 还是 B?
  • 这是否很奇怪?
  • 多少?
  • 组织方式为何?
  • 接下来该怎样做?

以上每个问题都由单独系列的机器学习方法(称为算法)回答。
将算法视为配方,数据视为成分可帮助理解。 算法告知如何组合以及混合数据以获取答案。 计算机如同搅拌机。 它们可快速完成算法的大部分繁琐工作。

“问题 1:这是 A 还是 B?”使用分类算法

让我们从这个问题开始:这是 A 还是 B?
5 个数据科学问题
此系列算法称为双类分类。
对于任何仅有两种可能答案的问题很有用。
例如:

  • 此轮胎是否会在下一 1,000 英里中出现故障:是或否?
  • 以下哪种方案可吸引更多顾客:5 美元优惠券或 25% 折扣?

此问题还可进行改述,来包括两个以上的选项:这是 A、B、C 还是 D,等? 这称为多类分类,当有多个或数千个可能的答案时很有用。 多类分类选择可能性最大的一个答案。

“问题 2:这是否很奇怪?”使用异常检测算法

下一个数据科学可以回答的问题是:这是否很奇怪? 此问题通过称为异常检测的算法系列进行回答。
5 个数据科学问题
如果有信用卡,那么已从异常检测获益。 信用卡公司分析购买模式,使他们可提醒用户可能的欺诈行为。 “异常”费用可能是在一家通常不会去购物的商店购物时,或购买非常昂贵的物品时所产生的费用。
此问题在很多方面都很有用。
例如:

  • 如果汽车上配有压力表,可能会想知道:此压力表读数是否正常?
  • 如果正在监控 Internet,就会想知道:此消息是否是来自 internet的典型消息?

异常检测标志意外或异常事件或行为。 它会提供在何处查找问题的线索。

“问题 3:多少?”使用回归算法

机器学习还可以预测“多少?”这一问题的答案。 回答此问题的算法系列称为回归算法。
5 个数据科学问题
回归算法进行数字预测,例如:

  • 下周二的气温是多少?
  • 我第四季度销售额有多少?

它们可帮助回答任何寻求数字答案的问题。

“问题 4:组织方式为何?”使用聚类分析算法

最后两个问题更高级一点。
有时希望了解数据集的结构 - 组织方式为何? 对于此问题,并没有已经知道结果的示例。
可通过多种方法梳理出数据结构。 其中一种方法就是聚类分析。 为方便解释,该方法将数据分成多个自然“群”。 使用聚类分析,不会存在正确答案。
5 个数据科学问题

聚类分析问题的常见

示例有:

  • 哪些观众喜欢同类型的电影?
  • 哪些打印机型号出现故障的方式相同?

通过了解数据的组织方式,可以更好地了解并预测行为和事件。

“问题 5:现在应该做什么?”使用强化学习算法

最后一个问题 – 现在应该做什么? - 使用称为强化学习的算法系列。
强化学习的灵感来自于老鼠和人类的大脑对惩罚和奖励的反应。 这些算法从结果中学习,并决定下一步操作。
通常,强化学习适用于自动系统,这些自动系统需要在没有人工指导的情况下做出大量小决策。
5 个数据科学问题

此算法总是用于回答此类问题:(通常指计算机或机器人)应采取何种操作。
示例如下:

  • 如果是房子的温度控制系统:调整温度或保持其原温度?
  • 如果是自动驾驶汽车:黄灯时,刹车或加速?
  • 对于机器人吸尘器:继续吸尘或返回充电站?

强化学习算法在执行过程中收集数据,从试验和错误中学习。
这就是数据科学可以回答的 5 个问题。

相关文章:

  • 2022-01-01
  • 2021-12-29
  • 2021-12-11
  • 2021-12-10
  • 2022-12-23
  • 2022-01-01
  • 2021-06-24
猜你喜欢
  • 2021-07-21
  • 2021-09-27
  • 2021-09-06
  • 2021-04-19
  • 2021-06-12
  • 2021-08-22
相关资源
相似解决方案