機器學習基本概念簡介

Posted Jan 11, 2026 Updated Jan 24, 2026

By 何翌闻

1 min read

機器學習基本概念簡介

机器学习是什么：让机器具备寻找函数的能力

Regression：假设函数的输出是一个数值scalar

Classification：选择

Step1:function with unknown

Step2:define loss from training data

Step3:optimization

输入是model里面的参数，也就是$L(b,w)$

输出就代表了这b,w这组数值有多好

那么应该如何计算呢？—根据训练资料

真实的值叫Label

\[w* ,b* =argMinL\]

Gradient Descent：先假设b不动，看看只有一个参数的情况—随机选择w₀，计算w对Loss的微分（也就是斜率），如果是负数就增加w，反之减小w，得到w₁,跨的步子有多大由斜率和learning rate（自己设定）同时决定

注意：Loss是自己定义的，所以可以是负的

什么时候会停下来？

但是，不一定会找到真正最好的解global minima，可能只找到局部最优解local minima（其实是一个假议题，这不是我们真正面对的难题）

多个参数，也是一模一样的道理！

Overfitting：在训练过的资料上变好，但是在没看过的资料上没有变好

This post is licensed under CC BY 4.0 by the author.