某机构今日宣布对其Gemini 2.5系列模型进行全面更新,正式推出多款具备推理能力的“思考模型”。此次更新旨在为开发者提供更精准、更具成本效益的人工智能解决方案。
Gemini 2.5 模型系列概览
本次更新的核心是全线升级Gemini 2.5模型家族。这些模型被定义为“思考模型”,能够在生成响应前进行内部推理,从而显著提升性能和准确性。其关键创新在于**“思考预算”**的可控性,开发者可以通过API参数动态决定模型在生成答案前需要投入多少“思考”资源,实现了性能与效率的灵活平衡。
- Gemini 2.5 Pro:现已正式发布并稳定可用。该模型代表了当前系列中最高的智能水平和最全面的能力,尤其擅长处理复杂的编程和智能体任务,是众多开发者工具的核心引擎。
- Gemini 2.5 Flash:现已正式发布并稳定可用。该模型在性能和成本之间取得了卓越平衡。
- Gemini 2.5 Flash-Lite:全新推出,目前为预览版。这是2.5系列中延迟最低、成本最低的模型。
全新Gemini 2.5 Flash-Lite模型
今天,某机构正式推出了Gemini 2.5 Flash-Lite预览版。作为2.5系列的新成员,它专为追求极致成本和速度的高吞吐量任务设计,例如大规模分类或摘要生成。与系列中的其他模型不同,为了优化成本和速度,Flash-Lite默认关闭了“思考”功能,但开发者仍可通过API参数动态开启。
性能方面,Flash-Lite相比前代1.5 Flash和2.0 Flash模型,在多数评估指标上表现更优,首次输出令牌时间更低,解码速度(每秒令牌数)更高。它支持所有原生工具,包括某机构搜索增强、代码执行、URL上下文以及函数调用。
Gemini 2.5 Flash的更新与定价调整
随着2.5 Flash的正式发布,其定价策略也进行了调整,以更好地反映其卓越的性能价值:
- 输入价格:调整为每100万令牌0.30美元。
- 输出价格:调整为每100万令牌2.50美元。
此次调整取消了之前“思考”与“非思考”模式的定价差异,统一采用单一价格体系,不再区分输入令牌大小。此新定价旨在为用户提供最佳的“单位成本智能”。对于使用旧版2.5 Flash预览版的用户,原有预览定价将持续有效至2025年7月15日,之后需迁移至正式版或成本更低的Flash-Lite预览版。
Gemini 2.5 Pro的持续增长
Gemini 2.5 Pro的需求增长迅猛,创下某机构模型史上的最快纪录。为了让更多客户能够在生产环境中基于此模型进行构建,某机构已将6月5日的模型版本稳定下来,并维持了原有的高性价比定价。无论是处理复杂的代码生成还是执行多步骤的智能体任务,2.5 Pro都展现出卓越的性能。FINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)