Datawhale X 李宏毅苹果书 AI夏令营

封面选自李宏毅老师苹果书，以下是阅读李宏毅老师苹果书5页搭配视频的阅读记录，第一次看机器学习，有点懵，但是还是了解了很多新概念，阅读过程中如果对苹果书里文段不理解，通过ai助手的回答能让我明白一些！

Part1：机器学习基础

机器学习：让机器具备找一个函数的能力。

根据找的函数的不同，机器学习有不同的类别。

Eg.找的函数的输出是一个数值、一个标量，这种机器学习的任务称为回归。（例如机器找一个函数f，输入今天PM2.5数值、平均温度、平均臭氧浓度，输出的是明天中午的PM2.5数值，找这个函数的任务称为回归）

除了回归任务，常见的还有分类任务。即让机器找一个函数做选择题，人类准备好一些选项，这些选项称为类别，函数从设定好的选项里选择一个作为输出，该任务叫做分类。分类不一定只有两个选项，可以有多个选项。（eg.邮箱筛查垃圾邮件、alphago下棋）

还有结构化学习：产生一个有结构的物体，让机器画一张图、写一篇文章，让机器产生有结构的东西的任务。

1、案例学习：预测频道流量信息

输入：今日后台流量信息

输出：预测隔天流量信息

机器学习找函数过程：

①写出一个带有未知参数的函数f

将该函数写成y=b+wx

y和x都是数值，b和w都是参数，未知，需要猜测（来源于对这个问题本质的了解，即领域知识，机器学习需要一些领域知识）

*y=wx+b

带有未知参数的函数称为模型

x称为特征，是这个函数里面已知的

w称为权重。b称为偏置（用来修正）

②定义损失（损失也是一个函数）

损失：函数L（b，w）

输入：y=b+wx模型里面的参数bw

输出：代表→如果把这组未知参数设定为某个数值时这笔数值优劣性。

计算损失：

真实值称为标签

估测值和真实值差距e（作差取绝对值）→每一天预测的误差

→损失L=1/N（所有e求和）

L越大代表这组参数越不好（误差越大）反之越好

差距计算方法（损失）

Ⅰ↑前文的那种方法指的是平均绝对误差（MAE）e = |yˆ − y|（所有数据点绝对误差的平均值）

Ⅱ均方误差（MSE）e = (ˆy − y)2

Ⅲ当y和y^都是概率分布→交叉熵

输入：真实的数据

输出：结果→调整不同bw求各种bw组合bw计算损失→画出等高线图

阅读过程中对“有一些任务中 y 和 yˆ 都是概率分布，这个时候可能会选择交叉熵（cross entropy），这个是机器学习的第 2 步。刚才举的那些数字不是真正的例子，以下的数字是真实的例子，是这个频道真实的后台的数据，所计算出来的结果。可以调整不同的 w 和不同的 b，求取各种w 和各种 b，组合起来以后，我们可以为不同的 w 跟 b 的组合，都去计算它的损失，就可以画出图 1.2 所示的等高线图。”这段话不是很理解

→通过ai助手解读

概率分布：在机器学习中，特别是在分类问题中，我们不仅关心预测的类别，还关心每个类别的预测概率。例如，在预测天气时，模型可能会给出“晴天”的概率是70%，“雨天”的概率是30%。
交叉熵（Cross Entropy）：这是一种衡量预测概率分布与实际分布差异的方法。如果模型的预测非常接近实际情况，交叉熵就会很小；如果预测与实际相差很大，交叉熵就会很大。
调整 w 和 b：这里的 ( w )（权重）和 ( b )（偏置）是模型中的参数。通过调整这些参数，我们可以让模型更好地拟合数据。
计算损失：对于不同的 ( w ) 和 ( b ) 的组合，我们计算它们对应的交叉熵损失，以此来评估每种组合的性能。
等高线图：这是一种图形表示方法，可以形象地展示不同 ( w ) 和 ( b ) 组合的损失值。等高线图类似于地形图，不同的高度代表不同的损失值，帮助我们直观地看到哪些参数组合的损失较小，从而找到最优的模型参数。