当前位置：首页 > news >正文

第3课：机器如何“学习”

news 2026/6/26 5:04:29

一、课程信息

课程主题：机器如何“学习”
适合对象：人工智能零基础学习者
预计学习时长：2小时
学习方式建议：把机器学习理解成“从例子中总结规律”，先建立直觉，再理解术语

二、学习目标

学完本课后，你应该能够：

用通俗语言解释机器学习的基本思想。
说清楚数据、标签、模型、训练、预测之间的关系。
理解训练集和测试集的作用。
知道为什么模型不能只“背答案”，还要能处理新问题。
能用猫狗识别、垃圾邮件识别等生活案例解释机器学习过程。

三、课程导入：机器真的会学习吗

当我们说“机器学习”时，很容易产生误解。

机器并不会像人一样拥有意识，也不会像人一样主动理解世界。

这里的“学习”更准确地说是：

机器从大量数据中寻找规律，并把这些规律保存到模型里，用来处理新的问题。

例如，人看到很多猫和狗的图片后，会逐渐知道猫和狗有什么区别。

机器也可以通过大量图片学习：

猫的耳朵通常是什么形状
狗的脸型可能有什么特征
不同动物的毛色、轮廓、姿态有什么差异
哪些特征更能帮助区分猫和狗

机器学习不是让机器“变成人”，而是让机器通过数据建立一种处理问题的能力。

四、先看一个生活例子：教小朋友认识苹果

假设你要教一个小朋友认识苹果。

你可能会这样做：

拿出一张红苹果图片，告诉他：“这是苹果。”
拿出一张青苹果图片，告诉他：“这也是苹果。”
拿出一张梨的图片，告诉他：“这不是苹果。”
拿出一张切开的苹果图片，告诉他：“这仍然是苹果。”
反复给他看很多例子。

看得多了，小朋友会慢慢总结规律：

苹果通常接近圆形
苹果可能是红色、绿色或黄色
苹果表面有果皮
苹果和梨、橙子、香蕉长得不一样

之后，你拿出一张他没见过的苹果图片，他也可能判断出来。

这就是学习的关键：

不是只记住看过的图片，而是总结出能用于新图片的规律。

机器学习也是类似过程。

五、机器学习的核心思想

机器学习的核心思想可以概括为一句话：

不把所有规则都提前写死，而是让机器从数据中自己总结规律。

1. 普通规则程序怎么做

如果用传统程序识别苹果，程序员可能要写很多规则：

如果颜色是红色，并且形状接近圆形，并且大小在某个范围内，那么可能是苹果。

但问题很快出现：

青苹果不是红色怎么办？
切开的苹果形状不完整怎么办？
光线不好导致颜色变化怎么办？
图片里有多个水果怎么办？
玩具苹果和真实苹果怎么区分？

现实情况太复杂，规则很难写完整。

2. 机器学习怎么做

机器学习不会要求程序员提前写出所有判断规则。

它更像这样：

给机器很多苹果和非苹果的例子 让机器从例子中寻找规律 用学到的规律判断新图片

这种方式特别适合处理规则复杂、变化多的问题。

例如：

图片识别
语音识别
用户推荐
风险判断
文本分类
价格预测

六、机器学习的基本流程

一个简化的机器学习流程可以表示为：

收集数据 → 标注数据 → 训练模型 → 测试模型 → 使用模型预测新问题

也可以换成更通俗的说法：

准备例题 → 给出答案 → 让机器练习 → 出新题考试 → 用于真实任务

下面逐步拆解。

七、数据：机器学习的原材料

1. 什么是数据

数据就是机器学习用来学习的材料。

不同任务需要不同类型的数据。

例如：

任务	需要的数据
识别猫和狗	猫狗图片
判断垃圾邮件	历史邮件内容
预测房价	房屋面积、位置、楼层、价格等信息
推荐短视频	用户观看、点赞、停留时长等行为
语音转文字	语音录音和对应文字

机器学习不是凭空产生能力。

它的能力来自数据中的规律。

2. 数据质量很重要

数据不是越多越好，还要质量高。

好的数据通常需要：

准确
清晰
多样
有代表性
尽量减少偏见
和实际使用场景接近

如果数据质量差，模型学到的规律也可能有问题。

这就是常说的：

垃圾进，垃圾出。

3. 数据质量差会带来什么问题

假设你训练一个识别猫狗的模型。

如果数据里：

猫的图片都很清晰，狗的图片都很模糊
猫都在室内，狗都在室外
猫图片数量很多，狗图片数量很少
图片标签有错误，把猫标成狗

模型可能学到错误规律。

它可能不是在学习“猫和狗的区别”，而是在学习“清晰和模糊”“室内和室外”的区别。

这说明：

数据会影响模型看世界的方式。

八、标签：带答案的学习材料

1. 什么是标签

标签就是数据对应的答案。

例如：

数据	标签
一张猫的图片	猫
一张狗的图片	狗
一封广告邮件	垃圾邮件
一封正常邮件	正常邮件
一套房子的面积、位置、楼层	实际成交价格

带标签的数据，就像带答案的练习题。

机器可以通过这些例子学习：

什么样的输入，对应什么样的输出。

2. 为什么标签重要

如果没有标签，机器可能不知道自己判断得对不对。

例如你给机器看一万张动物图片，但不告诉它哪些是猫、哪些是狗。

它也许能发现某些图片相似，但不一定知道这些相似图片应该叫“猫”还是“狗”。

标签就像老师批改作业。

没有批改，学生很难知道自己哪里错了。

3. 标签也可能出错

标签不是天然正确的，很多标签来自人工标注或历史记录。

如果标签错误，模型就会学到错误答案。

例如：

把猫图片标成狗
把正常邮件标成垃圾邮件
把用户真实不喜欢的内容标成喜欢
把错误诊断结果作为训练答案

所以在真实AI项目中，数据清洗和标签检查非常重要。

九、特征：帮助模型判断的线索

1. 什么是特征

特征可以理解为帮助模型做判断的线索。

例如判断一个水果是不是苹果，可以参考：

颜色
形状
大小
表面纹理
是否有果柄

这些都可以看作特征。

2. 不同任务有不同特征

任务	可能的特征
房价预测	面积、位置、楼层、房龄、交通
垃圾邮件识别	标题、关键词、链接数量、发件人、发送频率
商品推荐	浏览记录、购买记录、收藏记录、停留时长
学生成绩预测	出勤率、作业完成率、测验成绩、学习时长

3. 特征不等于原因

需要注意，模型发现的特征关联不一定代表真实原因。

例如一个模型发现“雨伞销量高的时候，交通拥堵也更严重”。

这不代表雨伞导致堵车。

更可能是因为下雨同时影响了雨伞销量和交通状况。

这提醒我们：

模型擅长发现规律，但人需要判断这些规律是否合理。

十、模型：机器总结出来的规律

1. 什么是模型

模型可以理解为机器学习后形成的一套规律。

它不是一本人能直接阅读的规则手册，而是一种可以根据输入给出输出的计算系统。

例如：

输入：一张动物图片 输出：猫的概率是90%，狗的概率是10%

或者：

输入：房屋面积、位置、楼层、房龄 输出：预测房价为300万元

2. 模型像什么

可以把模型想象成一个“经验总结器”。

它看过很多例子后，把规律保存下来。

以后遇到新问题时，它根据这些规律给出判断。

生活类比：

一位老师看过很多学生的学习情况后，可能会根据作业完成率、课堂表现和测验成绩，判断某个学生期末是否有风险。

模型也是根据历史数据中的规律做类似判断。

3. 模型不是数据库

初学者容易把模型理解成“存了很多答案的数据库”。

这并不准确。

数据库更像是：

你问它见过的问题，它查找并返回已有记录。

模型更像是：

它根据学到的规律，对没见过的问题做判断。

好的模型不应该只是记住训练数据，而应该能处理新数据。

十一、训练：让模型不断调整规律

1. 什么是训练

训练就是让模型通过大量例子不断调整自己。

一个简化过程是：

模型看到一个输入。
模型给出一个预测。
系统把预测和正确答案比较。
如果错了，就调整模型。
重复很多次。

可以用一句话理解：

训练就是模型不断做题、对答案、改错的过程。

2. 猫狗识别训练过程

假设要训练一个猫狗识别模型。

流程可能是：

给模型一张猫的图片 模型预测：狗 正确答案：猫 模型发现错了 调整内部规律 再给模型一张狗的图片 模型预测：狗 正确答案：狗 模型发现对了 保留或强化当前规律

经过大量图片训练后，模型逐渐变得更准确。

3. 训练需要很多轮

模型通常不会看一遍数据就学会。

它需要反复训练。

这类似学生复习：

第一遍可能只是熟悉题型
第二遍开始发现常见规律
第三遍逐渐减少错误
多次练习后表现更稳定

训练过程越复杂，通常需要的数据和算力也越多。

十二、预测：用学到的规律处理新问题

1. 什么是预测

预测是指模型训练完成后，用它处理新的输入。

这里的“预测”不一定是预测未来，也可以是做判断。

例如：

判断图片是不是猫
判断邮件是不是垃圾邮件
判断用户可能喜欢什么视频
预测明天的商品销量
预测某套房子的价格

2. 预测的关键是处理新数据

机器学习的价值在于处理没见过的新数据。

如果一个模型只会回答训练时见过的问题，它的价值很有限。

例如：

你训练了一个猫狗识别模型，它看过一万张图片。

真正有用的是：

它看到第10001张从未见过的图片时，也能判断是猫还是狗。

3. 预测结果可能是概率

很多AI模型不会只输出一个绝对答案，而是输出概率。

例如：

猫：87% 狗：13%

这表示模型认为图片更可能是猫。

但概率高不代表一定正确。

如果场景很重要，还需要人工审核或额外验证。

十三、训练集、验证集和测试集

1. 为什么要拆分数据

如果把所有数据都拿来训练，就很难知道模型是不是真的学会了。

这就像学生做题。

如果考试题和练习题一模一样，学生考高分不一定说明真正掌握了知识。

因此，机器学习通常会把数据拆成不同部分。

2. 训练集

训练集是给模型学习用的数据。

作用类似：

学生平时刷的练习题。

模型通过训练集学习规律。

3. 验证集

验证集用于在训练过程中调整模型。

作用类似：

阶段性小测验，用来判断当前学习方法是否合适。

不是所有入门课程都必须深入理解验证集，但知道它的用途有助于建立完整概念。

4. 测试集

测试集是模型训练完成后，用来检查效果的数据。

作用类似：

期末考试。

测试集不能参与训练，否则模型可能只是记住答案。

5. 一个简单例子

假设你有10000张猫狗图片。

可以这样拆分：

数据集合	数量	用途
训练集	7000张	让模型学习
验证集	1500张	训练过程中调整
测试集	1500张	最后检查效果

具体比例不是固定的，真实项目会根据数据量和任务调整。

十四、过拟合：只会背题，不会举一反三

1. 什么是过拟合

过拟合是机器学习中一个非常重要的问题。

通俗理解：

模型把训练数据记得太死，训练时表现很好，但遇到新数据就容易出错。

这就像学生只背熟了练习题答案，却没有真正理解知识点。

练习题一变，就不会做了。

2. 过拟合的例子

假设训练集中所有猫图片都有白色背景，所有狗图片都有草地背景。

模型可能错误地学到：

白色背景 = 猫 草地背景 = 狗

训练时它可能表现很好。

但如果出现一张在草地上的猫，它可能判断成狗。

这说明模型学到的是背景线索，而不是真正的动物特征。

3. 如何减少过拟合

入门阶段不需要掌握复杂方法，但要理解基本思路：

准备更多样的数据
确保训练数据接近真实场景
使用独立测试集检查效果
避免让模型只记住训练样本
让模型学习更稳定、更通用的规律

十五、欠拟合：学得太浅，规律没掌握

1. 什么是欠拟合

欠拟合和过拟合相反。

通俗理解：

模型太简单，或者训练不充分，连基本规律都没学好。

例如，一个猫狗识别模型连明显的猫和狗都分不清，就可能是欠拟合。

2. 欠拟合的常见原因

可能原因包括：

数据太少
特征不够有效
模型能力太弱
训练时间不够
任务本身太复杂

3. 生活类比

一个学生只看了两道例题就去考试，很可能没有掌握规律。

这就像欠拟合。

而一个学生把所有练习题答案都背下来，却不会做新题，就是过拟合。

两者都不是理想状态。

理想状态是：

既掌握训练材料中的规律，又能举一反三处理新问题。

十六、模型效果如何判断

1. 准确率

准确率是最容易理解的指标。

例如，模型判断100封邮件，其中90封判断正确。

那么准确率就是：

90%

但准确率不是所有场景都够用。

2. 错误类型也很重要

不同错误的后果可能不同。

例如垃圾邮件识别：

把垃圾邮件误判为正常邮件：用户多看到一封广告
把重要邮件误判为垃圾邮件：用户可能错过重要信息

第二种错误可能更严重。

再比如医疗场景：

漏掉高风险患者
把低风险患者误判为高风险

这两种错误成本也不同。

3. 评估要结合业务场景

模型效果不能只看一个数字。

还要问：

错误是否可接受
错误发生在哪些人群或场景
是否需要人工复核
模型结果是否稳定
数据是否会随时间变化

这也是为什么真实AI系统需要持续评估和更新。

十七、案例一：垃圾邮件识别

1. 问题是什么

目标：

判断一封新邮件是不是垃圾邮件。

2. 需要什么数据

需要历史邮件数据，例如：

邮件内容	标签
恭喜中奖，点击链接领取奖金	垃圾邮件
明天下午项目会议安排	正常邮件
限时优惠，立即购买	垃圾邮件
请查收本周工作总结	正常邮件

3. 模型可能学习什么规律

模型可能学习到：

某些词频繁出现在垃圾邮件中
可疑链接数量较多
标题过于夸张
发件人历史行为异常
内容重复度高

4. 训练完成后怎么使用

当一封新邮件到来时：

系统提取邮件内容和相关信息。
模型根据学到的规律做判断。
输出垃圾邮件概率。
邮箱系统决定是否放入垃圾箱。

5. 风险是什么

垃圾邮件识别不能只追求拦截更多垃圾邮件。

还要避免误伤正常邮件。

例如重要面试通知、合同邮件、客户邮件，如果被误判为垃圾邮件，影响会很大。

十八、案例二：猫狗图片识别

1. 问题是什么

目标：

给模型一张动物图片，让它判断是猫还是狗。

2. 需要什么数据

需要大量猫狗图片，并且每张图片有正确标签。

数据应该尽量多样：

不同品种
不同颜色
不同姿态
不同背景
不同光线
不同拍摄角度

3. 训练过程

训练过程可以简化为：

输入猫狗图片 模型做出判断 比较正确答案 调整模型 反复训练

4. 模型可能遇到的问题

模型可能在以下情况下出错：

图片模糊
动物被遮挡
猫狗长得相似
背景干扰明显
图片里同时有猫和狗

这些问题提醒我们：

AI在标准数据上表现好，不代表在所有真实场景中都可靠。

十九、案例三：房价预测

1. 问题是什么

目标：

根据房屋信息预测大致价格。

2. 需要什么数据

可能需要：

面积
城市
区域
楼层
房龄
户型
交通便利程度
学校和商圈情况
历史成交价格

3. 这是分类还是数值预测

猫狗识别输出的是类别：

猫 / 狗

房价预测输出的是数值：

预计价格：300万元

这说明机器学习可以处理不同类型的问题。

分类问题是判断属于哪一类。

数值预测是预测一个数字。

后续课程会进一步讲机器学习的基本类型。

4. 为什么房价预测不可能完全准确

房价会受到很多因素影响。

例如：

市场变化
政策变化
买卖双方心理
房屋装修情况
小区环境
数据是否及时

所以模型只能根据已有数据做估计，不可能保证完全准确。

二十、机器学习不是魔法

机器学习看起来很神奇，但它不是魔法。

它通常依赖几个条件：

有足够相关的数据。
数据质量较好。
问题目标比较明确。
模型选择比较合适。
训练和评估方法合理。
使用时有人监督和验证。

如果这些条件不足，AI效果就可能不稳定。

1. 没有数据，很难学习

如果想让机器判断某种罕见疾病，但几乎没有相关病例数据，模型就很难学到稳定规律。

2. 数据和目标不匹配，效果会差

如果用国外城市房价数据训练模型，却拿来预测国内城市房价，效果可能不理想。

因为数据环境不同。

3. 问题定义不清，模型也难做好

例如“判断一篇文章好不好”。

什么叫好？

语言流畅？
信息准确？
有说服力？
适合小学生？
适合专业人士？

如果目标不清楚，模型也很难学习。

二十一、人类在机器学习中扮演什么角色

机器学习不是完全自动发生的。

人类仍然非常重要。

1. 定义问题

人需要先明确：

要解决什么问题
输入是什么
输出是什么
成功标准是什么
错误成本是什么

2. 准备数据

人需要收集、清洗、标注和检查数据。

数据质量常常决定模型上限。

3. 选择方法

技术人员需要选择合适的模型和训练方式。

不是所有问题都需要最复杂的模型。

有时简单方法更稳定、更可解释、成本更低。

4. 评估结果

人需要判断模型结果是否真的有用。

尤其在重要场景中，人类审核不可替代。

5. 持续改进

现实世界会变化。

例如：

用户兴趣会变化
垃圾邮件套路会变化
市场价格会变化
新词和新表达会出现

所以模型也需要持续监控和更新。

二十二、课堂活动：设计一个简单机器学习任务

活动目标

通过设计任务，理解机器学习从数据到预测的完整流程。

活动任务

请选择一个你熟悉的场景，设计一个简单机器学习任务。

可选主题：

判断邮件是否为垃圾邮件
根据学习习惯推荐课程
根据商品评论判断用户是否满意
根据天气和日期预测奶茶销量
根据运动记录判断用户是否完成健身目标

填写模板

问题	你的设计
想解决什么问题
输入数据是什么
标签或答案是什么
模型需要学习什么规律
输出结果是什么
如何测试模型效果
可能出现什么错误

思考问题

这个任务是否有足够数据？
数据中的标签是否容易获得？
如果模型出错，会带来什么影响？
是否需要人工审核？

二十三、本课小结

本课我们学习了机器学习的基本过程。

需要重点记住：

机器学习不是机器像人一样有意识地学习，而是从数据中总结规律。
数据是机器学习的原材料，数据质量会直接影响模型效果。
标签是带答案的学习材料，可以帮助模型判断自己是否学对。
特征是模型做判断时使用的线索。
模型可以理解为机器从数据中总结出的规律。
训练是模型不断做题、对答案、改错的过程。
预测是用训练好的模型处理新问题。
训练集用于学习，测试集用于检查模型是否真正掌握规律。
过拟合像只会背题，欠拟合像连基本规律都没学好。
机器学习不是魔法，需要明确问题、可靠数据、合理评估和人工监督。

二十四、课后练习

练习1：猫狗识别需要哪些数据

假设你要训练一个模型识别猫和狗，请回答：

需要收集哪些图片？
每张图片需要什么标签？
为什么图片要尽量多样？
如果训练数据中猫很多、狗很少，可能会出现什么问题？

练习2：解释机器学习流程

请用自己的话解释下面几个概念：

概念	我的解释
数据
标签
模型
训练
预测
测试集

练习3：判断训练集和测试集

请判断下面说法是否正确，并说明原因。

测试集可以参与模型训练。
训练集就像学生平时做的练习题。
如果模型在训练集上表现好，就一定说明它在真实场景中表现好。
测试集的作用是检查模型能否处理没见过的数据。

练习4：分析垃圾邮件识别

请以垃圾邮件识别为例，填写下面表格：

问题	我的回答
输入数据是什么
标签是什么
模型可能学习哪些规律
输出结果是什么
哪种错误比较严重
是否需要用户反馈来改进

练习5：思考机器学习的边界

请回答：

为什么说机器学习不是魔法？
如果数据本身有偏见，模型可能会怎样？
为什么AI系统上线后还需要持续监控？

二十五、参考答案与提示

练习1参考提示

需要收集大量猫和狗的图片，并确保每张图片都有正确标签。

图片应尽量多样，包括：

不同品种
不同颜色
不同背景
不同姿态
不同光线
不同拍摄角度

如果猫的图片很多、狗的图片很少，模型可能更倾向于判断为猫，导致识别不公平或不稳定。

练习2参考提示

概念	参考解释
数据	机器学习用来学习的材料
标签	数据对应的正确答案
模型	机器从数据中总结出的规律
训练	模型不断学习、对比答案、调整规律的过程
预测	用训练好的模型处理新输入
测试集	用来检查模型是否能处理没见过数据的一组数据

练习3参考答案

不正确。测试集不应参与训练，否则无法公平检查模型效果。
正确。训练集就是模型学习规律的主要材料。
不正确。模型可能只是记住训练数据，遇到新数据仍然出错。
正确。测试集用于模拟模型面对新问题时的表现。

练习4参考提示

问题	参考回答
输入数据是什么	邮件标题、正文、发件人、链接、发送时间等
标签是什么	垃圾邮件或正常邮件
模型可能学习哪些规律	关键词、可疑链接、标题风格、发件人行为等
输出结果是什么	是否为垃圾邮件，或垃圾邮件概率
哪种错误比较严重	把重要正常邮件误判为垃圾邮件通常更严重
是否需要用户反馈来改进	需要，例如用户手动标记垃圾邮件或恢复正常邮件