课程大纲
What is Machine Learning
1.定义
机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。
2.机器学习的应用场景
- 存在隐含的模式可以学习,也就是说可以通过学习可以提升表现度量
- 没有程式化的定义,或者定义问题很难,难以使用普通编程问题来解决
- 有大量可供学习的数据
Components of Machine Learning
基本的符号约定
- input:
x∈X - output:
y∈Y - unknown pattern to be learn:
f:X⇒Y - data:{
[(x1,y1),(x2,y2).....(xN,yN)] } - hypothesis:
g:X⇒Y ,一个机器学习模型对应很多hypothesis,通过算法选择一个最好的hypothesis
机器学习流程
所以我们也可以这样描述机器学习,通过一个演算法,利用数据,去学习一个好的模型,接近最真实的模型。
Machine Learning and Other fields
机器学习与数据挖掘的关系
数据挖掘是利用大量的数据去发现有趣的特性
- 如果interesting property 和 hypothesis that approximate target是一样的时候,两者等价
- 如果interesting property 和 hypothesis that approximate target相关的时候,两者可以互相帮助
- 数据挖掘也关注在大数据集上的高效计算
机器学习与人工智能的关系
机器学习是是实现人工智能的一种方式
机器学习和统计的关系
- 统计是机器学习有用的工具
- 传统的统计主要关注,数学假设结果的正确性,而不关心计算问题