機器學習基本概念簡介
機器學習基本概念簡介
机器学习是什么:让机器具备寻找函数的能力
不同的类别
Regression:假设函数的输出是一个数值scalar
Classification:选择
机器怎么寻找一个函数
Step1:function with unknown
Step2:define loss from training data
Step3:optimization
Loss:也是一个函数
输入是model里面的参数,也就是$L(b,w)$
输出就代表了这b,w这组数值有多好
那么应该如何计算呢?—根据训练资料
真实的值叫Label
Optimization
\[w* ,b* =argMinL\]Gradient Descent:先假设b不动,看看只有一个参数的情况—随机选择w0,计算w对Loss的微分(也就是斜率),如果是负数就增加w,反之减小w,得到w1,跨的步子有多大由斜率和learning rate(自己设定)同时决定
注意:Loss是自己定义的,所以可以是负的
什么时候会停下来?
- 达到步数上限
- 找到微分是0的点
但是,不一定会找到真正最好的解global minima,可能只找到局部最优解local minima(其实是一个假议题,这不是我们真正面对的难题)
多个参数,也是一模一样的道理!
Overfitting:在训练过的资料上变好,但是在没看过的资料上没有变好
This post is licensed under CC BY 4.0 by the author.




