news 2026/2/22 16:09:00

震惊!Meta“牛油果“AI模型偷偷“拜师“阿里通义千问,程序员:代码能力碾压GPT-5?这波操作太秀了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
震惊!Meta“牛油果“AI模型偷偷“拜师“阿里通义千问,程序员:代码能力碾压GPT-5?这波操作太秀了!

Meta转向闭源AI模型训练,竟采用阿里巴巴通义千问技术。通义Qwen3-Max在代码能力、智能体表现和数学推理方面全球领先,超越GPT-5等国际主流模型。马云回归后推动阿里全面AI转型,投入3800亿元建设AI基础设施,标志着中国科技从商业模式创新转向硬核技术创新的新时代,中国工程师红利获得国际认可。

代码不讲政治,强就是强,弱就是弱。

出品 | 环球科技局 作者 | 刘峰

在很长一段时间里,关于中国科技互联网的故事,似乎总是充满了“模仿”与“追赶”的叙事。

然而,就在最近,大洋彼岸的硅谷传来了一条让许多业内人士颇感意外,却又在情理之中的消息。

据彭博社最新消息,Meta正在开发代号“牛油果”的闭源AI模型,而训练过程中采用的第三方模型之一,正是阿里巴巴的通义千问。

这则消息背后,是Meta从开源转向闭源的战略调整,也是中国AI技术获得全球顶尖科技公司认可的重要标志。

一、战略转身,巨头Meta陷入两难

**Meta(原名 Facebook)**是全球最大的社交媒体与科技巨头之一,与苹果、微软、谷歌、亚马逊并称为美国科技界的“五大巨头”。

简单来说,它的业务可以概括为:“用社交软件赚钱,把赚来的钱砸向未来科技”

如今的Meta正在经历自成立以来最深刻的AI战略调整。这家长期以开源模式著称的科技巨头,正在扎克伯格的亲自领导下转向闭源模型开发。

知情人士透露,这一转变源于Meta对今年早些时候发布的开源模型Llama 4的表现不满。扎克伯格随即亲自介入,组建了名为TBD Lab的团队,并推动公司从开源模式转向能够直接带来收入的闭源模型

新模型代号“牛油果”(Avocado),预计将在2026年春季亮相,将以闭源形式发布,由Meta完全控制并向外部出售访问权限。这种商业策略与谷歌及OpenAI保持一致,标志着Meta在多年强调“开放”后出现的重大战略转变。

Meta创始人扎克伯格 | 图源:ifanr

重点来了,多家媒体爆料,Meta团队训练新模型时将采用多家第三方AI技术,包括谷歌的Gemma、OpenAI的gpt-oss及阿里巴巴的通义千问

而就在今年年初,扎克伯格还曾表示担忧中国模型可能受到国家审查的影响,并呼吁美国政府在AI竞赛中支持科技企业。如今,Meta却采用阿里巴巴的技术来训练自己的核心AI模型,这种转变意味深长。

并且,公司的战略调整还带来了显著的组织架构与人事变动。

Meta收购了Scale AI并将其创始人Alexandr Wang任命为首席AI官。此人正是是闭源路线的坚定支持者。

但与此同时,被誉为“AI教父”之一的Yann LeCun因对公司资源分配及开源战略重视不足感到不满而离开Meta。

因此,可以说Meta选择阿里技术并非偶然。

右为Alexandr Wang | 图源:ifanr

当然,决定性的因素肯定还是技术。

2025年9月24日,在云栖大会上,阿里发布了通义旗舰模型Qwen3-Max。这款模型预训练数据量达36T tokens,总参数超过万亿。

**Qwen3-Max的性能已超过GPT5、Claude Opus 4等国际主流模型,跻身全球前三。**其预览版在Chatbot Arena排行榜上位列第三,正式版在多项基准测试中表现更优。

Qwen3-Max展现出的三大核心能力,使其成为Meta“牛油果”项目理想的参考模型:

首先,顶尖的代码能力:在专注于解决真实世界编程难题的SWE-Bench Verified基准测试中,Qwen3-Max-Instruct取得了69.6分的成绩,稳居全球顶尖模型之列。

其次,突破性的智能体表现:在评估智能体工具调用能力的Tau2-Bench测试中,Qwen3-Max-Instruct以74.8分的突破性表现,超越了Claude Opus 4与DeepSeek-V3.1等强劲对手。

最后,卓越的数学推理能力:Qwen3-Max的推理增强版本Qwen3-Max-Thinking-Heavy,在AIME 25和HMMT等高难度数学推理测试中取得了100%的准确率。这是国内大模型在该类评测中的最佳纪录。

除了强大的基础模型能力,阿里还构建了全栈AI技术体系。从底层芯片、超节点服务器、高性能网络、分布式存储、智算集群到人工智能平台,阿里云已形成完整的技术闭环。

通义开源模型下载量已突破6亿次,全球衍生模型达17万个,稳居全球第一。超100万家客户接入通义大模型,在中国企业级大模型调用市场中,阿里通义占比第一。

二、马云回归,阿里AI逐步起飞

Meta对阿里技术的选择,恰逢马云回归后阿里全面向AI转型的关键时期。

2025年以来,马云频繁现身阿里园区和重要活动现场,引发了外界对其“强势回归”的广泛关注。

图源:财联社

马云回归背后,是阿里面临的严峻挑战和转型压力。在电商领域,阿里市场份额已远不及2013年的巅峰时期。甚至在2024年双11期间,拼多多使用时长首次超越淘宝。

资本市场对阿里的表现也不乐观,其市值一度被拼多多超越。而在2023年3月启动的“1+6+N”组织架构调整,短时间内反而造成了战略协同的混乱。

面对这些挑战,马云推动阿里进行了历史性的组织调整:**合伙人制度历史性“瘦身”,9位代表阿里传统价值观的“长老”退出。**阿里形成了“资本-技术-业务”铁三角组合——蔡崇信代表资本,吴泳铭代表技术,蒋凡代表业务。

这一权力结构的收拢,显著提升了决策效率。马云为这场必要的、激进的组织变革进行背书,让内部相信这一转型不是权宜之计,而是创始人高瞻远瞩的战略方向。

在业务战略上,阿里确立了“AI+大消费”的双核驱动模式。消费方面,淘宝闪购联合饿了么,角逐即时零售市场;AI方面,阿里宣布未来三年投入3800亿元用于AI基础设施建设。

图源:财联社

可以说,马云的回归为阿里注入了最稀缺的两种东西:战略定力与决策魄力。

根据彭博社透露的细节,马云曾要求核心团队每日汇报AI研发进展,单日三次追问大模型训练数据,向整个组织传递出“此事优先级至高无上”的强烈信号。

2025年云栖大会上,阿里集团CEO吴泳铭明确表示,阿里云将通过两大核心路径实施AI战略:

第一,通义千问坚定开源开放路线,致力于打造“AI时代的Android”;第二,构建作为“下一代计算机”的超级AI云,为全球提供智能算力网络。

马云也在蚂蚁集团强力推进AI战略。2025年12月1日,他佩戴工牌现身蚂蚁园区,为全模态通用AI助手“灵光”站台。

而“灵光”也不负所望,上线三天后便跻身iOS免费工具榜第一,兑现了马云“要往前冲第一”的目标要求。

三、阿里Qwen背后,是无数日夜辛劳的工程师

硅谷巨头反过来使用国产大模型进行训练,这确实是马云的胜利,因为通义千问背后的阿里云智能集团,是马云在阿里体系内最坚定支持的战略遗产之一。

当年在所有人都盯着淘宝天猫的GMV时,是阿里坚持在达摩院和云技术上投入重金,才有了今天能够跑在大模型前列的算力底座。

但从另一个角度看,这恰恰标志着“马云时代”的某种终结,和中国科技新时代的开始。

过去的二十年,我们的高光时刻往往属于“商业模式的颠覆者”。我们津津乐道于双十一的成交额,自豪于外卖的配送速度,骄傲于移动支付的普及率。

那时候的英雄是马云、是刘强东……他们的成功,建立在巨大的人口红利和商业效率优化之上。

而今天Qwen 的成功,属于另一群人。

它属于那群在阿里云园区里默默调参的算法工程师,属于那群在显卡资源受限的情况下死磕数据质量的研究员。他们不再依靠“眼球经济”或“流量变现”来获得认可,而是靠硬碰硬的测试成绩,靠代码的执行效率,靠逻辑推理的准确性。

**Meta 使用 Qwen,是对中国工程师红利的最高奖赏。**它证明了,当潮水退去,当资本泡沫破裂,当所有的商业模式创新都碰到了天花板时,唯有底层的硬核技术,才具有穿越周期的力量。

不过,华尔街也对Meta持续的高额资本支出表示担忧,扎克伯格需要向市场证明其“超级智能”战略的可行性。

在Meta总部,TBD Lab团队被安排在扎克伯格办公桌周围,以便他随时检查“牛油果”项目的进展。同一时间,杭州阿里园区里,工程师们正在优化通义千问的下一个版本。

这场跨越太平洋的技术对话,预示着全球AI竞争格局正在发生深刻变化。中国科技公司已从学习者,转变为被全球巨头认真对待的竞争者和合作者。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/20 21:26:08

ReadCat电子书阅读器:重新定义数字阅读的终极指南

ReadCat电子书阅读器:重新定义数字阅读的终极指南 【免费下载链接】read-cat 一款免费、开源、简洁、纯净、无广告的小说阅读器 项目地址: https://gitcode.com/gh_mirrors/re/read-cat 你是否曾经为市面上电子书阅读器的复杂界面和繁琐操作感到困扰&#xf…

作者头像 李华
网站建设 2026/2/20 21:33:52

MegSpot终极教程:10分钟掌握图片视频对比神器

MegSpot终极教程:10分钟掌握图片视频对比神器 【免费下载链接】MegSpot MegSpot是一款高效、专业、跨平台的图片&视频对比应用 项目地址: https://gitcode.com/gh_mirrors/me/MegSpot MegSpot是一款高效、专业、跨平台的图片与视频对比应用,作…

作者头像 李华
网站建设 2026/2/20 19:17:35

Day 87:动态分配多维数组陷阱

上节回顾:上一讲介绍了C11的静态断言(_Static_assert),详细分析了其编译期校验机制、典型用途(类型/结构体大小、常量关系等)、常见陷阱(编译器标准、表达式限制、宏封装冲突)&#…

作者头像 李华
网站建设 2026/2/21 18:47:31

如何快速掌握BDInfo:5个实用技巧的完整指南

如何快速掌握BDInfo:5个实用技巧的完整指南 【免费下载链接】BDInfo BDInfo from http://www.cinemasquid.com/blu-ray/tools/bdinfo 项目地址: https://gitcode.com/gh_mirrors/bd/BDInfo BDInfo作为一款专业的蓝光光盘信息分析工具,能够帮助用户…

作者头像 李华