从 0 开始学 AI:第 1 课,普通软件和 AI 软件有什么区别?
- 1. 为什么要先理解这个问题?
- 2. 普通软件是怎么工作的?
- 3. AI 软件是怎么工作的?
- 4. 普通软件和 AI 软件的核心区别
- 5. AI 的三个核心概念:数据、模型、训练
- 5.1 数据
- 5.2 模型
- 5.3 训练
- 6. 训练和推理有什么区别?
- 6.1 训练是什么?
- 6.2 推理是什么?
- 7. AI 不是简单地“查规则”
- 8. 用猫狗识别理解 AI 的完整流程
- 8.5 数据、模型、训练的关系
- 9. 本节课的核心总结
- 10. 本节课的关键词
- 11. 我的阶段理解
- 12. 本节课后的自测问题
- 这一课的最终记忆版
1. 为什么要先理解这个问题?
刚开始学习 AI 的时候,最容易被各种名词吓住:
机器学习 深度学习 大模型 训练 推理 参数
Token Embedding GPU RAG Agent
但在进入这些复杂概念之前,最应该先弄明白一个基础问题:
AI 软件和普通软件到底有什么区别?
如果这个问题理解清楚,后面学习机器学习、深度学习、大模型时,就会轻松很多。
2. 普通软件是怎么工作的?
普通软件的核心特点是:
人写规则,软件执行规则。
比如一个简单的折扣计算程序:
如果订单金额大于 100 元,打 9 折。
如果订单金额大于 500 元,打 8 折。
如果订单金额大于 1000 元,打 7 折。
这些规则都是人提前写好的。软件本身并不会主动学习,它只是按照程序员写好的逻辑一步一步执行。
再比如一个传统的垃圾邮件判断程序,可能会这样写规则:
如果邮件标题包含“中奖”,判断为垃圾邮件。
如果邮件内容包含“免费领取”,判断为垃圾邮件。
如果邮件里有可疑链接,判断为垃圾邮件。
这种方式的优点是清晰、可控。
但缺点也很明显:规则需要人不断维护,遇到新情况时,软件可能就判断不出来。
例如垃圾邮件换一种说法:
恭喜你获得专属福利,请立刻查收。
如果程序里没有这条规则,普通软件可能就识别失败。
3. AI 软件是怎么工作的?
AI 软件的核心特点是:
不是主要靠人写死规则,而是通过数据训练模型,让模型从数据中学习规律。
还是以垃圾邮件识别为例。
普通软件的做法是:
人写很多判断规则。
AI 软件的做法是:
给模型很多邮件样本:
这封是垃圾邮件。
这封不是垃圾邮件。
这封是垃圾邮件。
这封不是垃圾邮件。然后让模型从这些样本中学习规律。
模型可能会学到:
什么样的词经常出现在垃圾邮件里?
什么样的标题更像广告?
什么样的链接更可疑?
什么样的语气更像营销内容?
训练完成后,再来一封新邮件,模型就可以根据学到的规律判断它是不是垃圾邮件。
4. 普通软件和 AI 软件的核心区别
可以用一句话概括:
普通软件是规则驱动,AI 软件是数据驱动。
也可以这样理解:
普通软件:人告诉机器规则,机器按规则执行。
AI 软件:人提供数据和目标,机器从数据中学习规律。
对比如下:
| 对比项 | 普通软件 | AI 软件 |
|---|---|---|
| 核心方式 | 人写规则 | 数据训练模型 |
| 规则来源 | 程序员提前定义 | 模型从数据中学习 |
| 适合任务 | 规则明确、流程固定的任务 | 规律复杂、难以手写规则的任务 |
| 典型例子 | 计算器、订单系统、表单系统 | 图像识别、语音识别、推荐系统、聊天机器人 |
| 遇到新情况 | 可能需要修改代码 | 可能通过更多数据继续优化 |
下面的架构图展示了普通软件与AI软件在系统设计上的根本差异:
5. AI 的三个核心概念:数据、模型、训练
理解 AI,先抓住三个关键词:
数据 模型 训练
5.1 数据
数据是 AI 学习的材料。
比如:
图片 文本 语音 视频 用户点击记录 交易记录 医学影像 传感器数据
没有数据,AI 就很难学习规律。
例如要训练一个识别猫狗的 AI,就需要大量猫和狗的图片。
5.2 模型
模型可以先理解成:
一个能够从数据中学习规律,并对新输入做出判断或生成内容的系统。
不同任务会有不同模型:
垃圾邮件识别模型:判断邮件是不是垃圾邮件。
图像识别模型:判断图片里是什么。
语音识别模型:把声音转成文字。
推荐模型:预测用户可能喜欢什么。
大语言模型:根据上下文生成回答。
在 AI 里,模型不是普通意义上的“模型玩具”,而是一个由大量参数组成的计算系统。
5.3 训练
训练就是让模型通过大量数据不断学习规律的过程。
训练过程可以简单理解为:
经过大量重复后,模型就会越来越擅长某类任务。
例如猫狗识别模型一开始可能分不清猫和狗。
经过大量猫狗图片训练后,它会逐渐学会猫和狗在耳朵、脸型、身体结构、毛发、姿态等方面的区别。
6. 训练和推理有什么区别?
学习 AI 时,经常会遇到两个词:
训练 推理
这两个词非常重要。
6.1 训练是什么?
训练是模型学习的过程。
例如:
给模型看大量猫狗图片,让它学习猫和狗的区别。
训练通常需要:
大量数据
较长时间
较高算力
不断调整模型参数
训练的目标是让模型掌握某类任务的规律。
6.2 推理是什么?
推理是使用训练好的模型处理新输入。
例如:
模型已经学过很多猫狗图片。 现在给它一张新的图片。 它判断这张图片是猫还是狗。
这个判断过程就是推理。
也可以理解成:
训练:学习阶段。
推理:使用阶段。
举例:
| 场景 | 训练 | 推理 |
|---|---|---|
| 猫狗识别 | 看大量猫狗图片,学习区别 | 输入一张新图片,判断猫或狗 |
| 垃圾邮件识别 | 看大量邮件样本,学习垃圾邮件特征 | 判断一封新邮件是否是垃圾邮件 |
| 大语言模型 | 从大量文本中学习语言规律 | 用户输入问题,模型生成回答 |
| 语音识别 | 学习大量语音和文字对应关系 | 把一段新语音转成文字 |
7. AI 不是简单地“查规则”
很多人刚开始会以为 AI 只是在查规则库。
其实不是。
普通软件更像这样:
如果 A,就执行 B。
如果 C,就执行 D。
AI 更像这样:
看过大量样本后,学到某种规律。
遇到新情况时,根据学到的规律做判断。
需要注意的是,AI 学到的规律不一定会以人类能直接读懂的规则形式存在。
比如一个猫狗识别模型,它不一定会明确写出:
耳朵尖的是猫。
嘴巴长的是狗。
胡须明显的是猫。
它更可能是在大量图片中学习到复杂的特征组合,然后根据这些特征综合判断。
所以,AI 不是简单地查固定规则,而是通过数据学习统计规律,并把这些规律保存在模型的内部参数里。
8. 用猫狗识别理解 AI 的完整流程
假设我们要训练一个能识别猫和狗的 AI。
整个过程大概是:
这里面有几个关键点:
- 图片数量要足够多。
- 图片最好要有正确标签。
- 图片要尽量多样化。
- 模型需要经过反复训练。
- 训练完成后,模型才能对新图片进行推理。
如果训练数据太单一,模型可能会学偏。
比如训练数据里的猫都是白色的,狗都是黑色的,那么模型可能误以为:
白色 = 猫
黑色 = 狗
这就说明,数据质量会直接影响 AI 的效果。
8.5 数据、模型、训练的关系
理解AI的三个核心概念(数据、模型、训练)之间的关系至关重要:
三者关系说明:
- 数据是燃料,为模型提供学习材料
- 训练是引擎,驱动模型从数据中学习
- 模型是容器,存储学习到的规律
- 推理是应用,使用训练好的模型处理新任务
这个闭环体现了AI系统的核心工作原理:用数据训练模型,让模型具备推理能力。
9. 本节课的核心总结
这一课最重要的是理解四句话:
普通软件主要靠人写规则。
AI 软件主要靠数据训练模型。
训练是让模型学习规律。
推理是使用训练好的模型处理新输入。
再进一步,可以总结成一句话:
普通软件是规则驱动,AI 软件是数据驱动。AI 通过数据训练模型,让模型学习规律,再用训练好的模型处理新的输入。
10. 本节课的关键词
| 关键词 | 简单解释 |
|---|---|
| 数据 | AI 学习的材料 |
| 模型 | 从数据中学习规律的系统 |
| 训练 | 让模型通过数据学习规律 |
| 推理 | 使用训练好的模型处理新输入 |
| 参数 | 模型内部可调整的数值 |
| 标签 | 训练数据对应的正确答案 |
| 规则驱动 | 人写规则,机器执行 |
| 数据驱动 | 机器从数据中学习规律 |
11. 我的阶段理解
通过这一课,我对 AI 有了一个初步认识:
普通软件是人为指定规则,软件按照指令执行。
AI 软件不是主要靠人写死规则,而是通过大量数据训练模型,让模型学习数据中的规律。训练完成后,模型可以对新的输入进行判断、预测或生成内容。
以猫狗识别为例,训练时需要给模型大量带标签的猫狗图片,让它学习猫和狗的区别。训练完成后,再输入一张新的动物图片,模型就可以根据之前学到的规律判断图片中是猫还是狗。
12. 本节课后的自测问题
可以用下面几个问题检查自己是否理解:
- 普通软件和 AI 软件最大的区别是什么?
- 什么是训练?
- 什么是推理?
- 为什么说 AI 不是简单查规则?
- 如果要训练一个识别猫狗图片的 AI,需要准备什么数据?
如果能用自己的话回答这些问题,就说明已经掌握了本节课的核心内容。
这一课的最终记忆版
你可以把下面这段作为最精简的复习卡片:
普通软件:人写规则,机器执行规则。
AI 软件:人提供数据,模型从数据中学习规律。训练:模型通过大量数据学习规律,并调整内部参数。
推理:模型训练完成后,利用学到的规律处理新输入。AI 不是简单查规则,而是通过数据学习复杂规律。 训练猫狗识别模型,需要大量带标签的猫狗图片。
这节课你已经掌握得不错。下一课可以进入:AI、机器学习、深度学习、大模型之间到底是什么关系。