news 2026/6/25 4:40:34

GPT-5.2 和 Harmonic 似乎已经自主解决了一个迄今为止人类尚未解决的埃尔德什问题。

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GPT-5.2 和 Harmonic 似乎已经自主解决了一个迄今为止人类尚未解决的埃尔德什问题。

人工智能帮助解决以前无法解决的数学问题的案例越来越多。

据报道,OpenAI 的 GPT-5.2 解决了 Erdős 问题 #728,这似乎是一个重要的里程碑,标志着人工智能首次在任何人类数学家之前自主解决了一个未解的数学猜想。



剑桥大学数学系学生 AcerFur 在 X 平台上宣布了这项突破性进展,此前他曾与他人合作进行验证。该问题旨在探究是否存在无穷多个整数 a、b、n,满足特定的整除性和涉及阶乘的不等式条件。自提出以来,该问题一直未得到解决。具体而言,该问题是:“设 C>0 且 ϵ>0 足够小。是否存在无穷多个整数 a、b、n,满足 a≥ϵn 且 b≥ϵn,使得 a!b!∣n!(a+b−n)! 且 a+b>n+Clogn?”

根据 AcerFur 的描述,GPT-5.2 生成了初始解决方案和证明,随后 Harmonic 的 Aristotle 系统使用 Lean 中的形式化验证对其进行了验证。Lean 是一款证明辅助工具,可提供机器可验证的正确性保证。Aristotle 最初解决了一个稍弱的变体,但能够自主修复其证明,最终无需人工干预即可获得完整的结果。

重要注意事项

AcerFur强调了这项成就的三个关键缺陷。首先,原始问题描述含糊不清,该模型求解的是一种数学界普遍认为最有可能产生非平凡解的解释。其次,该解决方案似乎深受数学家Carl Pomerance先前工作的启发,这引发了人们对人工智能贡献究竟有多新颖的质疑。第三,目前尚不清楚有多少尚未发表的文献探讨了如何解决此类问题的特殊情况。

该解决方案源于 AcerFur 和 X 用户 Liam06972452 的合作。Liam06972452 首先收到了 GPT-5.2 的响应并请求验证。AcerFur 解释说,GPT-5.2 完成了繁重的数学运算,而 GPT-5.2 Pro 则随后将证明结果格式化为完整的 LaTeX 论文格式,并在格式化过程中可能进行了验证并填补了其中的空白。

人工智能数学领域的发展势头

这项成就紧随Harmonic公司近期另一项成果之后。Harmonic是一家数学人工智能初创公司,由Robinhood首席执行官Vlad Tenev创立。去年11月,Harmonic宣布其亚里士多德系统解决了埃尔德什问题124,该问题自1995年发表以来,已悬而未决近30年。

然而,数学界对这一说法反应较为谨慎。维护埃尔德什问题网站的托马斯·布鲁姆承认这一成就令人印象深刻,但他指出,所解决的版本只是埃尔德什提出的两个变体中较简单的一个,而且事后看来,解决方案相对简单直接,难度与人工智能已展现出强大实力的数学竞赛题目相当。

埃尔德什问题指的是保罗·埃尔德什提出的数学猜想。埃尔德什是20世纪最多产的数学家之一,一生发表了1500多篇论文。解决埃尔德什问题被认为是数学界的一项重大成就,埃尔德什本人也根据他对问题难度的评估,为解答者提供奖金。

形式化验证的优势

这两项成果都凸显了形式化验证在验证人工智能生成的数学运算结果方面的重要性。Harmonic 的方法以 Lean 为核心,Lean 是一种形式化语言,它允许对每个解决方案进行验证,直至其基本公理,从而无需人工数学家手动检查输出结果的准确性。

2025年初,Harmonic宣布其模型Aristotle在2025年国际数学奥林匹克竞赛中取得了金牌级别的成绩,在六道题目中给出了五道可验证的正确答案。这使得Harmonic与谷歌DeepMind和OpenAI等科技巨头并驾齐驱,这两家公司也分别凭借各自的模型取得了类似的成绩。

启示与问题

如果这些论断得到更广泛的数学界的验证,它们可能标志着人工智能系统发展的一个转折点,人工智能系统将不再仅仅满足于掌握现有的问题集,而是开始贡献原创性的数学发现。然而,关于这些解决方案的真正创新性、它们在多大程度上受到训练数据的影响,以及它们究竟代表了真正的数学洞察力还是复杂的模式匹配,仍然存在诸多疑问。

第 728 题最初表述的模糊性,以及 GPT-5.2 的解决方案大量借鉴了前人研究成果这一事实,凸显了评估人工智能对数学贡献的复杂性。尽管这些系统展现出了令人瞩目的能力,但它们究竟是在进行全新的研究,还是仅仅以新的方式重组了现有知识,仍然是一个值得探讨的问题。可以肯定的是,人工智能系统正在迅速接近,甚至可能已经达到了对数学研究做出有意义贡献的门槛。这是否标志着人工智能与人类在数学领域合作的新时代——或者更具变革性——还有待观察。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/17 22:27:56

汽车焊接工艺参数优化的方法和案例

焊接工艺参数的重要性与挑战在现代汽车制造领域,焊接工艺参数的优化是保证产品质量和生产效率的核心环节。焊接参数包括电流、电压、焊接速度、热输入量等多个维度,它们不仅影响焊缝的微观结构,还直接关系到整车的密封性、强度以及耐久性。然…

作者头像 李华
网站建设 2026/6/15 18:56:19

当云原生遇见VMware

技术融合背景云原生与VMware的协同价值,传统虚拟化与容器化技术的互补性,企业混合云转型需求。VMware在云原生生态中的角色VMware Tanzu产品套件解析(TKG、TAP、TMC),vSphere与Kubernetes集成(VCF&#xff…

作者头像 李华
网站建设 2026/6/17 22:57:04

Switch文件传输与RCM注入全攻略:NS-USBLoader深度体验

Switch文件传输与RCM注入全攻略:NS-USBLoader深度体验 【免费下载链接】ns-usbloader Awoo Installer and GoldLeaf uploader of the NSPs (and other files), RCM payload injector, application for split/merge files. 项目地址: https://gitcode.com/gh_mirro…

作者头像 李华
网站建设 2026/6/24 17:47:11

Gerber文件查看器的实用指南:从入门到精通

Gerber文件查看器的实用指南:从入门到精通 【免费下载链接】gerbv Maintained fork of gerbv, carrying mostly bugfixes 项目地址: https://gitcode.com/gh_mirrors/ge/gerbv 在电子设计制造领域,Gerber文件查看器是连接设计图纸与物理产品的桥梁…

作者头像 李华
网站建设 2026/6/20 4:28:55

从TIOBE 2025年度语言到2026智能体生态:C#的二次崛起与范式革新

2026年初,TIOBE指数正式将C#授予2025年度编程语言称号,这是其三年内第二次获此殊荣,标志着这门曾被定义为"企业级传统语言"的编程语言,已完成向AI时代核心开发工具的华丽转型[__LINK_ICON]。从TIOBE榜单上的逆势增长到2…

作者头像 李华