阿里云MaaS业务Token收入增长显著
阿里云在5月20日的发布会上透露,阿里云MaaS业务的Token收入在2026年的过去5个月里增长了15倍,月度Token收入已达数亿元级别。拉动这笔收入的直接原因是Agent。
为何急于发布新模型?
这一天,阿里云发布了新一代旗舰模型Qwen 3.7 Max等产品,距Qwen 3.6 Max面世仅一个月。随着今年2月OpenClaw爆火,各模型厂商针对Agent提升模型Coding能力,大模型Coding能力之争白热化,阿里需推出在Coding方面有竞争力的模型,以保持MaaS业务竞争力。阿里云公共云总裁刘伟光表示:“未来是Agent Cloud的时代。”巧合的是,同一天硅谷的Google I/O大会主题也是Agent Cloud,Google新发布的产品几乎都围绕Agent展开。Agent Coding已成为全球现阶段的AI共识。
“千问云”官网有何特别?
发布会推出新“千问云”官网,这是为Agent设计的网页,也是阿里云成立17年以来首次为单独业务做的独立官网。阿里云公共云事业部负责人刘伟光称:“千问云是为Agent设计的,而不是人类。”这源于2024年底阿里云内部判断:未来云计算产品主要使用对象将从人类工程师变为Agent。过去,开发者或企业在云上部署服务,需人类工程师一步步操作,上手门槛高。但千问云官网上线后,动线改变,Agent先找模型,再找工具和skills,最后找底层云资源。例如,龙虾上线后,Agent一天内可自动完成云计算资源开通,而人类需两周。刘伟光表示:“未来不需要人来开通了,Agent自动就在后台把云计算资源激活了。”
Qwen 3.7 Max表现如何?
官网只是开始,阿里云从上层模型到Infra到底层芯片都围绕Agent重新适配。新一代旗舰模型Qwen 3.7 Max推出,距Qwen 3.6 Max发布仅一个月。尽管阿里在开源领域有影响力,但旗舰模型未享受到小龙虾最大红利。Qwen 3.7 Max的发布是阿里在Coding领域的反击。在业界最权威的代码能力测试中,Qwen 3.7 Max追平DeepSeek最强版本,在复杂工程任务测试中排第一。与上一代相比,Qwen 3.7 Max长周期任务能力大幅强化,Agent可自主执行复杂任务,无需人类中途介入。长程任务能力越强,Agent独立完成任务复杂度越高、人类介入越少,这也是当下最强Agent产品的核心竞争维度。阿里云CTO周靖人举例,在平头哥新芯片平台上,Qwen3.7 - Max通过自主编程和超1000次工具调用,实现平台关键内核自我进化,推理速度提升10倍,能像成熟工程师一样解决代码问题、开发复杂功能。这些任务的完成离不开芯片和Infra的适配,阿里云新一代训推一体AI芯片真武M890和自研互联芯片ICN Switch 1.0搭载在超节点服务器上,适用于Agent大规模并发场景。目前,阿里平头哥PPU芯片出货超54万片,已在悟空、秒悟等AI应用中提供推理服务。
Token生意如何做大?
Agent爆发带来Token消耗爆发,Agent本质是代码生成,一次任务调用Token量是普通对话场景的十倍甚至百倍。Agent共识演变成模型市场明牌战争,谁的模型在Agent场景下被调用得多,谁就获收入。当今市场最大赢家是Anthropic,据华尔街日报,其营收预计二季度增长一倍以上,达109亿美元。阿里云也受益,2025年自然年全年营收超1466亿元,营收增速28.6%,主要得益于AI产品。阿里巴巴CEO吴泳铭透露,6月份季度,包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入(ARR)将突破100亿元,年底突破300亿元。不过,阿里和字节打法不同。刘伟光强调:“Token带来的收入主要来自大语言模型和视频模型,但过去很多人将两个市场Token增量混为一谈,不合适。”字节占据视频模型市场,Seedance 2.0爆火后,字节在视频模型市场Token日均消耗占整个市场80%。2025年底火山目标2026年MaaS服务收入超100亿,Seedance 2.0爆火后目标上调。阿里云则在大语言模型上占优势,刘伟光称:“有开发者的公司才需要云,阿里云存量客户几乎都是Coding潜在用户。”2025年底,阿里云目标“2026拿下AI云市场增量的80%”,将业务火力集中在Coding领域,称今年前5个月已拿到LLM模型市场增量的80%。为配合目标,阿里云改变销售考核方式,不看Token销量,而看Token价值。阿里云追求模型接入客户核心业务系统数量,因为进入企业核心生产流程,Token消耗量指数级上升,单价高、复购稳定、收入质量高。Coding的Token消耗逻辑和视频不同,视频模型Token消耗是一次性的,代码场景是自我进化过程。如今大模型竞赛是系统工程较量,芯片、Infra与大模型耦合影响训练和推理效率,商业竞争加速验证场景价值,为模型反哺智能。刘伟光表示:“芯片、模型和云,现在三者就像是齿轮要和在一起、螺旋上升的过程。如果未来拼的是每一块芯片都能跑出比竞争对手更多的Token、更高质量的Token,‘那我们就胜利了’。”
刘伟光分享阿里云、Agent趋势Token之战观点
1. 云计算的天花板因Agent被打开。云计算时代商业模式简单但有痛点,企业内部软件开发和人力外包预算云计算吃不到,而AI Coding能命中。互联网企业Token支出达IT支出15% - 20%,传统企业在5%以下,阿里云目标是每个客户收入中Token收入占比不低于20%。以汽车行业和金融领域为例,Agent带动模型和存量云市场,Token和云天然绑定,Coding是重要方向。2. Agent是云业务增长飞轮。Token和GPU有换算比例,Agent爆发后,一张GPU卡消费带动一张CPU卡消费,厂商需强大CPU云服务Agent,存在收入闭环。3. 阿里云销售体系需变革。单独给大客户配纯MaaS销售,与卖IaaS销售配合。云产业经营久有思维惯性,做MaaS挑战大,且越传统企业越易拥抱AI。4. Token之战追求数量更追求质量。不看对话堆出的调用量,看付费Token客户数增长、客户核心系统接入模型解决刚需、Agent自主完成任务闭环效率。美国也追求用最少Token完成最有效任务。MaaS应是有利润的生意,百炼平台和模型团队优化推理框架。中国目前按量为主,终极目标是让客户为结果付费。