news 2026/5/26 11:30:07

数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

来源:跟着大咖学AI


著名数学家、菲尔兹获得者陶哲轩在最近的一次视频访谈中谈到AI并发表了自己的观点。他认为,训练和运行大语言模型和其他现代AI所需的数学知识并不高深,本科数学专业的基础就足够支撑,核心只需掌握矩阵乘法和基础微积分。

人类早已掌握大语言模型的搭建、训练和运行方法,真正的核心难题并非“如何让模型跑起来”,而是缺乏可靠的理论框架来提前预测其任务表现。

以下相关视频和文字内容:

『 训练和运行大语言模型(或其他现代 AI)所需的数学知识并没有那么复杂。本科数学专业的学生就已经具备了必要的相关知识 —— 本质上,你只需要掌握矩阵乘法和一点微积分就行。

The mathematics required to train and run a large language model (or any other modern AI) isn’t that complicated. An undergraduate math major already has all the necessary prerequisites—basically, you just need to understand matrix multiplication and a bit of calculus.

真正的难点不在于让这些模型 “如何运行”,我们已经知道怎么构建、训练和操作大语言模型了。难点在于理论层面我们缺少可靠的方法来评估或预测它们的性能。

The real challenge isn’thowthese models run (we know how to build, train, and operate large language models). Instead, the problem lies in theory: we lack a reliable way to evaluate or predict their performance.

让人意外的是,这些模型在某些任务上表现极佳,在另一些任务上却效果很差,但我们没法提前预判哪些任务会是哪种情况。我们甚至连基础的经验法则都没有,只能依赖实证实验。

What’s surprising is that these models work extremely well for some tasks but poorly for others—and we can’t predict which tasks will fall into which category in advance. We don’t even have basic heuristic rules of thumb for this; we can only rely on empirical experiments.』

视频来源:

https://www.youtube.com/watch?v=ukpCHo5v-Gc ,油管 ,@DrBrianKeating

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 21:07:42

ue5 插件 WebSocket

WebSocket Plugin for Unreal Engine fab中搜索: WebSocket 2025 https://blog.csdn.net/qq_17523181/article/details/134514744 插件:2022年: https://github.com/inveta/InWebSocketClient

作者头像 李华
网站建设 2026/5/22 11:35:33

基于nodejs+Vue的二手书估价回收平台_r7iyy6nh

文章目录 技术架构概述核心功能模块特色与创新点技术实现细节 项目技术介绍开发工具和技术简介nodejs类核心代码部分展示结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 技术架构概述 Node.js与Vue.js结合构建的二手书估价回收平台…

作者头像 李华
网站建设 2026/5/25 1:38:48

aarch64启动代码编写:向量表与异常向量入门教程

aarch64启动代码实战:向量表与异常处理从零搭建你有没有遇到过这样的场景?板子一上电,程序还没跑进main()就死机了,串口输出一片空白,JTAG也连不上——这种“卡在黑暗中的bug”,往往就藏在那几十行不起眼的…

作者头像 李华
网站建设 2026/5/25 15:21:14

emwin双缓冲技术实现完整指南

emWin双缓冲技术实现完整指南从一个“撕裂的进度条”说起你有没有遇到过这样的场景?在调试一块工业触摸屏时,用户滑动一个调节条,界面上的数值明明在变化,但显示却像卡顿了一样,甚至出现上下错位的“断裂线”——就像画…

作者头像 李华
网站建设 2026/5/20 12:18:28

右键图片直接转换图片格式,告别繁琐的格式转换(IMGConverter)

IMGConverter是一款图片格式转换工具,这类的工具其实很多,但是操作起来却比较繁琐。 通常情况下我们要“打开软件”—“上传图片”—“选择转换格式”—“转换”—“保存”,但是这款工具简化了这些不必要的程序。打开软件后,点“…

作者头像 李华
网站建设 2026/5/21 10:27:11

利用AI技术降低论文重复率:六大工具改写文本的高效技巧与策略

排名 工具/方法 核心优势 适用场景 1 aibiye 智能降重学术语言优化 初稿完成后深度润色 2 aicheck 多维度查重选题辅助 全程论文质量监控 3 秒篇 一键生成逻辑结构优化 紧急补论文初稿 4 AskPaper 文献解析重点提炼 文献综述与理论支撑 5 知网人工降重 专…

作者头像 李华