news 2026/5/21 2:34:04

连熬大夜帮大家总结了一下Google I/O 2026开发者大会,Gemini 3.5 Flash评价

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
连熬大夜帮大家总结了一下Google I/O 2026开发者大会,Gemini 3.5 Flash评价

昨晚连咖啡都没敢多喝,就为了盯着 Google 这一场被行业等了半年的发布会。

2026 年了,大模型那点事儿其实大家都看腻了。现在的关键是,谁能把这玩意儿真正塞进普通人的日子里,而且还得让用户感觉不到 AI 的存在。

Google 这一波,玩的就是“底层基建合围”。

发布会现场

我把这次发布会所有的细节、坑点以及那些可能影响咱们未来一年饭碗的逻辑都梳理出来了。内容很深,建议大家先收藏,咱们慢慢聊。

01 模型层:Gemini 3.5 Flash 到底是干活的还是吹牛的?

这次 Gemini 3.5 Flash 成了主角,这事儿其实挺有意思。

通常咱们都盯着 Pro 版看,但 Google 这次把 Flash 推到前面,传递了一个很明确的信号:大家别再纠结智商上限了,赶紧把成本打下来,把速度提上来去干苦力。

Gemini 3.5 Flash

我仔细看了一下 3.5 Flash 的跑分,发现了一个细节。它的编码能力和工具调用(Tool Calling)比上一代的 3.1 Pro 还要强一截。在那个衡量真实世界价值的 GDPval-AA 测试里,它跑出了 1656 分,比 3.1 Pro 高出了三百多分。

这就很有意思了。这意味着什么?

这意味着它是一个“偏科生”。它牺牲了一部分高深莫测的抽象推理(比如那些人类最后考试的变态题),把所有的技能点都加在了“听得懂人话、写得出代码、调得动接口”这些实操环节上。

跑分对比

说白了,它就是为了 Agent 准备的。原本要盯着屏幕手动搬运半小时的任务,现在用 3.5 Flash 泡杯咖啡的功夫就自动跑完了。

但大家要注意一个坑:它的知识截止日期是 2025 年 1 月。我之前实测的时候发现,如果你问它一些最新的市场波动,它还是会一本正经地胡说八道。虽然有 100 万的上下文窗口,但如果不外接搜索,还是容易翻车。

速度对比

至于价格,虽然比上一代 Flash 贵,但比 Pro 便宜了 40%。说句扎心的,现在全网 Token 涨价是大势所趋,哪怕是 Google 也不例外。

价格表

如果你还在等 3.5 Pro,官方说下个月才给。目前所有的 Gemini App 默认都已经换成这个 3.5 Flash 了。

上线通知

体验入口

当然,如果要接 api 的,国内的中转平台都已经飞速上了Gemini 3.5 Flash模型,亲测可用,可以去试试

至于那个被吹上天的 Gemini Omni Flash,我劝大家先降降预期。我实测了一下,中文口音带点港台腔不说,逻辑响应偶尔还会断片,目前看确实不如 Seedance 稳。

评论截图

唯一的亮点是能局部修改视频片段,比如保持背景不变换个模特的衣服,这个对做短视频的朋友可能有点用。

视频修改演示

02 开发者注意:Antigravity 2.0 里的成本陷阱与机会

这部分其实才是最硬核的。很多人不知道,Google 正悄悄把老旧的开发工具全部干掉,逼着大家往新架构上迁。

那个曾经被我们嫌弃得要死的 Antigravity,现在竟然版本跃迁到 2.0 了。

Antigravity 2.0

最绝的是,它出了一个独立桌面应用。这不再是一个 IDE 的附属插件,而是一个真正的 Agent 工作台。

独立桌面应用

这里有个死命令:到 2026 年 6 月 18 日,Gemini CLI 和 Code Assist 扩展就要停服了。还没迁的工作流赶紧动起来,别到时候代码跑不通了在那哭。

现场演示最骚的一段是,用 Antigravity 配合 3.5 Flash,从零写一个操作系统。整整 93 个小 Agent 在那并行跑,处理了 26 亿个 Token。

大家看这个成本数据:1.5 万次模型请求,才花了不到 1000 美金。

OS演示

在 Antigravity 2.0 里,3.5 Flash 跑起来竟然比以前快了 12 倍。这个速度,如果不把成本压到极致,普通的小公司根本玩不动。

提速对比

03 真正让老鸟兴奋的:Agent 电商与金钱流转

如果说前面聊的是技术,那接下来这块聊的就是“钱”了。

我发现很多同行都没注意到 UCP(Universal Commerce Protocol)和 AP2 这两个协议。

这特么才是真正的王炸。

你想想,以前 AI 只能帮你找链接,现在它要帮你付钱了。

UCP协议

Google 联手了 Shopify、Etsy,甚至连 Amazon、Meta 这种老对头都坐到一张桌子上了。这个 UCP 协议,说白了就是 Agent 时代的“普通话”。

巨头联手

而那个 AP2(Agent Payments Protocol),解决了“Agent 乱花钱”的问题。你可以给它设个“护栏”:只能买特定牌子的猫粮,单价不能超过 200。

满足了这些条件,它才敢伸手去划你的信用卡。每一笔账单都有数字授权书,商家赖都赖不掉。

AP2授权

最绝的是那个 Universal Cart(全能购物车)。

全能购物车

你在刷 YouTube 时看中一个耳机,在 Gmail 收到一个配件推荐,在搜索时发现个主板,全部一键塞进这个购物车。

购物车场景

它在后台会帮你盯着价格,什么时候降价了它提醒你。甚至还会帮你检查“智商税”:如果你买的 CPU 和主板接口不匹配,它会直接弹出来说“嘿,哥们,你这配出来的电脑点不亮,换一个”。

这种逻辑一旦跑通,原本要在不同 App 之间切来切去半小时的决策,现在只要一句话就结账了。

04 那些藏在角落里的“狠货”

除了这些大块头,还有几个细节我想聊聊。

1. 搜索框 25 年来最大的手术

现在的搜索框不只是让你打字了,视频、图片、文件全都能扔进去。

最让我惊讶的是 Search Agents。你可以创建一个盯着某几只股票的 Agent。PE 小于 15、现金流必须是正的,一旦触发条件,它直接给你推警报。这种把信噪比拉满的功能,才是真正懂实战的人需要的。

搜索Agent

还有一个骚操作:Agentic Coding。 你搜“黑洞如何影响时空”,它不只是给你个链接,它会在结果页里直接写代码,渲染出一个互动的、可以拉参数的 3D 模型给你看。这种生成式 UI 的进化,可能真的要革了传统网页的命。

生成式UI

2. Docs Live:告别提示词工程师

之前咱们用 AI 写东西,得在 Prompt(提示词)上磨半天。

现在 Docs Live 的思路变了:你像个老板一样在那“瞎指挥”就行。

现场那个工程师,一会儿调简历,一会儿说加个表格,一会儿又改口说日期从周四改成周五。AI 就像个老练的秘书,你说话的同时,文档就在那自动成型。

Docs Live演示

这种“一边胡言乱语一边干活”的体验,才是 AI 应该有的样子。

3. Android Halo:Agent 的“控制台”

Spark 这种个人 Agent 在云端 24 小时干活,你怎么盯它的进度?

Android Halo 出来了。它在状态栏有个专门的区域。

Android Halo

这就很有意思了。以前我们的手机是以 App 为核心的,你要点开 App 才知道发生了什么。

现在是以 Agent 为核心。Agent 做到了哪一步、需不需要你点一下头,全在那条状态栏里。这是一个全新的 UI 层级,大家可以多琢磨琢磨这背后的交互逻辑。

05 关于硬件、算力与那张“和解”的图

最后说几个挺感慨的点。

Google 终于发了音频眼镜。没镜片,就是靠声音交互。现场那个姑娘戴着眼镜说“带我去上周见面那个地方”,导航就设好了,甚至还顺便问要不要下单她常喝的那杯冷萃。

音频眼镜

这种场景不再是科幻片,它就是今年秋天要发的产品。

而在算力层,第八代 TPU 竟然搞了双芯片路线。训练归训练,推理归推理。那个 Flash 模型在推理芯片上跑出了每秒 1500 个 Token 的速度。

TPU演示

这是什么概念?你还没看完上一行,下一页已经写完了。这种暴力美学式的提速,就是为了支撑前面提到的那些庞大的 Agent 矩阵。

但整场发布会最让我意外的,是这张图:

巨头联手水印

OpenAI 竟然加入了 Google 的 SynthID 水印协议。

这两家打了多少年了?今天竟然为了“AI 合规”这件事坐到了一起。这说明 AI 生成的假信息已经泛滥到了巨头们必须联手止损的程度。这背后的博弈,值得细品。

结语

写了这么多,其实我最想分享的是 Hassabis 结束时说的那句话。

他说:“当我们回望这个时刻,会意识到我们正站在奇点的山脚下。”

以前我觉得这类话都是公关稿里的陈词滥调,但昨晚看完 Google 的这套打法——从芯片架构到通信协议,从开发工具到消费端购物车——我真的信了。

大模型的热闹看完了,接下来是 Agent 真正割接我们生活的时代。

希望大家在这个新黄金时代,不仅仅是见证者。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/21 2:27:48

设备与网版管控—双面丝印对位与清晰度硬件核心

双面丝印的精度与清晰度,60% 取决于设备性能与网版质量。与单面丝印相比,双面丝印对丝印机对位精度、工作台平整度、刮刀系统稳定性、网版张力与精度要求更高,任一硬件环节不达标,都会导致上下层对位偏差、字符模糊、渗墨、漏印等…

作者头像 李华
网站建设 2026/5/21 2:27:08

SolidWorks 服务器通过云飞云共享云桌面10人研发共享方案

摒弃传统一人一台三维工作站模式,搭建高性能三维设计服务器,搭配云飞云共享云桌面系统,实现 10 名研发设计师共用一台服务器资源,全员同时流畅使用 SolidWorks 进行建模、装配、工程图、仿真设计,降采购成本、提升软件…

作者头像 李华
网站建设 2026/5/21 2:24:07

VASP结构优化保姆级避坑指南:ISIF=3还是手动扫描晶格常数?

VASP结构优化实战指南:晶格常数与原子坐标的精准调控策略 在计算材料科学领域,VASP作为第一性原理计算的黄金标准工具,其结构优化环节往往是整个研究工作的基石。许多初学者常陷入一个典型困境:面对全新的材料体系,究竟…

作者头像 李华
网站建设 2026/5/21 2:24:04

成都销售强力巨彩的LED显示屏企业

痛点深度剖析在LED显示屏领域,我们团队在实践中发现,许多客户在实际应用中面临着诸多共性难题。首先,显示效果不稳定是普遍存在的问题,尤其是在长时间使用后,屏幕会出现亮度不均、色差等问题。其次,系统兼容…

作者头像 李华