去年 Google I/O 大会还在探讨 Gemini 2.5 版本,短短一年间,谷歌便相继推出 3.0、3.1 系列,如今又迎来 3.5 版本。从今日起,Gemini 3.5 Flash 将在谷歌众多产品中逐步上线,谷歌宣称该模型比上一代 Pro 模型更出色。
生成式 AI 目前是个烧钱的领域,特别是构建需长时间运行以完成复杂任务的自主体验时,成本问题更为突出。Gemini 3.5 Flash 每秒可输出近 300 个 token,基准测试得分却与速度仅为其四分之一的 3.1 Pro 相近。谷歌表示,使用大量 AI token 的公司改用该模型,每年可节省 10 亿美元。
在定价方面,Gemini 3.5 Flash 也展现出明显优势。其 API 定价明显低于所取代的 Pro 模型,每 100 万个输入 token 定价 1.5 美元,每 100 万个输出 token 定价 9 美元,而 3.1 Pro 模型起始定价分别为 2 美元和 12 美元,使用超 20 万个 token 价格更高。
编辑观点:谷歌 Gemini 3.5 Flash 在效率和成本上的双重优势,有望在生成式 AI 市场占据有利地位,后续发展值得关注。