“ChatGPT 一本正经地编了一个不存在的论文。”
“AI 给出的代码根本跑不起来。”
“它明明不知道,却回答得特别自信。”
如果你经常使用 AI,大概率已经遇到过这种情况,AI 看起来什么都懂,结果一验证:
全是假的。
这类问题,在 AI 领域有一个专门名字:
幻觉(Hallucination)
它不是 bug,甚至可以说:
“胡说八道”本身,就是大模型工作机制的一部分。
今天这篇文章,我们就来聊一聊大模型的幻觉。
大模型最大的危险,不是它不会。
而是它“太会说了”。
一、先说结论:AI 根本不知道“真相”
很多人第一次使用 AI 时,会产生一种错觉:
它像是在“思考”。
但实际上:
大模型并不是“真理引擎”。
它真正做的事情只有一件:预测下一个最可能出现的词
比如你输入:
牛顿发现了 →模型会预测:
- 万有引力
- 三大定律
- 引力定律
因为这些词在训练数据里最常一起出现。
它并不是:
- 去查数据库
- 验证历史
- 检查事实
而只是:
根据概率生成“最像正确答案的话”。
所以从第一天开始:
大模型就不是为了“真实”设计的。
它是为了:
“像人类语言”。
二、为什么 AI 会“一本正经地胡说八道”?
因为它优化的目标是:流畅性(Fluency)
而不是:真实性(Truth)
比如下面两个回答:
“我不知道。”
“根据 1897 年《欧洲物理学年鉴》的研究……”
虽然 第二个回答 可能是编的,但在人类反馈数据里:更长、更详细、更像专家,往往会得到更高评分,于是模型学会了一件事:
“越像真的,越容易被认为是好的回答。”
于是,AI 开始:自信输出、自动补全细节、编造上下文、补齐不存在的信息
这就是幻觉的本质。
三、为什么会出现幻觉呢
1:训练方式决定了它会“猜”
大模型训练的核心叫:Next Token Prediction(下一个词预测)
比如:
北京是中国的 →模型预测:
首都它训练几十万亿次后,逐渐形成语言能力,但问题是:它从来没有“真假判断系统”。
它只有:概率系统、语言模式系统
所以,当知识缺失时,它不会像搜索引擎那样:
查不到结果而是:
继续生成最合理的话于是就开始编。
2:训练数据本身就有大量错误
互联网并不是真理,模型训练数据包括:
- 论坛
- 博客
- 评论
- 社交媒体
- 过时内容
- 错误信息
AI 会把这些全部学进去,问题是:
它并不知道谁对谁错。
它只能学习:“哪些内容更常同时出现”。
所以,如果错误信息在网上传播很多,模型就可能把它当“高概率事实”。
3:模型会“补全模式”
这是最可怕的一点,大模型特别擅长:模式补全
比如你问:
请给我一篇 2012 年关于量子计算的论文即使不存在,模型也会:
- 自动生成作者名
- 自动生成 DOI
- 自动生成期刊
- 自动生成引用格式
因为:
它太熟悉“论文长什么样”。
于是,它会“伪造一个非常像真的东西”,这就像:人类考试不会时瞎编。
但 AI 的瞎编:
极其专业。
4:RLHF 让 AI 更像人,也更会编
现代聊天 AI 都用了:RLHF(人类反馈强化学习)
比如 OpenAI 的 ChatGPT,人类会给模型打分:
- 哪个回答更自然
- 哪个更友好
- 哪个更详细
结果出现一个副作用:
模型学会了“讨好人类”。
于是,它越来越不愿意:承认不知道、拒绝回答、中断生成
因为:“完整回答”通常更容易得到高评分,这进一步加剧了幻觉。
四、怎么解决幻觉?
现在主流方案,大概有几种。
方案 1:RAG(检索增强生成)
这是目前最重要的方法,原理非常简单:
先查资料,再让 AI 回答。
流程:
用户提问 ↓ 系统搜索知识库 ↓ 把真实资料喂给模型 ↓ 模型基于资料生成答案这样:模型不再纯靠“记忆”,而是:
基于真实文档回答。
这就是很多企业 AI 的核心架构。
比如:
- 企业知识库机器人
- AI 客服
- AI 法律助手
- AI 医疗问答
几乎都在用 RAG。
方案 2:工具调用(Tool Use)
让 AI:不会就去查
比如:
- 调用搜索引擎
- 查数据库
- 调用计算器
- 执行代码
- 访问 API
这也是为什么现在 AI 越来越像 Agent,因为:
“外部工具”正在弥补模型本身的缺陷。
方案 3:让模型学会“不知道”
这是近两年很重要的方向,训练模型:承认不确定、输出置信度、学会拒答
比如:
我无法确认这个信息真实性虽然体验没那么“聪明”,但可靠性会提升很多。
方案 4:多模型交叉验证
类似“AI 审 AI”,一个模型回答,另一个模型:检查事实、检查逻辑、检查引用
未来可能会形成:
生成模型 + 验证模型 + 搜索模型的组合系统。
五、结语
所以,为什么大模型会胡说八道?因为它从来不是:
“事实机器”。
它是:
“语言概率机器”。
它擅长的是:
- 生成像人类的话
- 模拟知识表达
- 补全语言模式
而不是:
- 判断真伪
- 理解现实
- 保证真实性
幻觉不是偶然,而是生成式 AI 的代价,但也正因为这种“自由生成能力”,AI 才拥有了:
- 创造力
- 泛化能力
- 多场景适应能力
所以未来真正重要的,不是:
“AI 会不会犯错”。
而是:
我们怎样建立一整套机制,让 AI 在犯错时依然可靠。