news 2026/2/26 20:19:13

谷歌Gemini和苹果的顶级华人科学家离职创业,剑指AGI

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
谷歌Gemini和苹果的顶级华人科学家离职创业,剑指AGI

谷歌 Gemini 数据联合负责人 Andrew Dai 联手苹果首席研究科学家 Yinfei Yang,隐身创办 AI 新秀 Elorian。首轮将融资 5000 万美元,剑指「视觉推理」这个下一代大模型的核心问题。

硅谷的 AI 创业热潮中,最昂贵的筹码永远押注在最资深的「大脑」上。

曾在谷歌 DeepMind 效力长达 14 年的资深研究员 Andrew Dai,正在筹建一家名为Elorian的 AI 初创公司。

这家尚不为人所知的公司,种子轮融资目标即高达 5000 万美元。

与 Andrew Dai 联手的,是刚于去年 12 月离职的苹果研究科学家 Yinfei Yang。

这两位分别来自谷歌和苹果的技术老兵,正在试图解决大模型领域的下一个核心问题:视觉推理(Visual Reasoning)

领投这轮融资的,极有可能是由前 CRV 普通合伙人 Max Gazor 创立的 Striker Venture Partners。

如果交易达成,这将是硅谷近期最受瞩目的早期融资之一,也再次印证了资本市场对于「谷歌毕业生」的疯狂追捧。

14 年,从 BERT 早期到 Gemini 幕后

在 AI 研究圈,Andrew Dai 这个名字代表着一种「长期主义」。

不同于那些在 Transformer 浪潮爆发后才匆匆入局的创业者,Andrew Dai 在谷歌的工号可以追溯到 2012 年。

这意味着他完整经历了深度学习从边缘学科走向世界中心的整个周期。

在他的 LinkedIn 履历中,最引人注目的是他作为Gemini 模型预训练(Pre-training)数据工作的联合负责人

在当前的大模型战争中,数据质量和预训练策略被认为是决定模型智商上限的关键因素。

能够在这个核心环节担任负责人,足以证明他在谷歌内部的权重。

Andrew Dai 的学术贡献不仅限于此。

他曾与谷歌首席科学家 Jeff Dean 以及 Quoc V. Le(Google Brain 的传奇人物)共同撰写过多篇论文。

早在 2015 年,他发表的一篇关于半监督序列学习(Semi-supervised Sequence Learning)的论文,就被认为对后来 OpenAI 的 GPT 系列模型产生了深远的启发。

https://proceedings.neurips.cc/paper/2015/file/7137debd45ae4d0ab9aa953017286b20-Paper.pdf

一位熟悉 Andrew Dai 的人士评价道:「他是语言模型的先驱之一,过去二十年一直专注于预训练相关的研究。他最擅长的,就是如何从海量、嘈杂的数据源中提炼出高质量的“知识”。」

如果说 Andrew Dai 代表了谷歌在大数据处理上的暴力美学,那么联合创始人 Yinfei Yang 则带来了苹果系的精致与多模态视角。

Yinfei Yang 此前在苹果机器学习团队担任首席研究科学家(Principal Research Scientist),主要参与苹果自研 AI 模型的开发。

在加入苹果之前,他也曾在 Google Research 工作过四年,专注于多模态表示学习。

他在图像-文本共嵌入(Image-text Co-embedding)领域的专长,恰好填补了单纯语言模型的感知短板。

视觉推理
不只是「看见」,更要「理解」

Elorian 究竟想做什么?

根据 Andrew Dai 的说法,Elorian 并不是要再造一个 ChatGPT,而是要构建一个能够「同时理解和处理文本、图像、视频和音频」的原生多模态模型。

目前的 AI 模型大多是基于文本训练,再通过「补丁」的方式接入视觉能力。

而 Elorian 的愿景是构建一个天生的「通感者」。

这种模型不再是将图片转化为文字标签,而是像人类一样,通过视觉直接感知物理世界的逻辑。

「视觉推理」被认为是通向 AGI 的必经之路。

Andrew Dai 提到,机器人将是 Elorian 技术的一个潜在应用场景,但他强调公司的愿景远不止于此。

在硅谷的投资人眼中,这通常意味着 Elorian 瞄准的是AI 智能体的广阔市场——一个能够像人类一样看着电脑屏幕、理解图形用户界面(GUI)、处理退货流程、审核法律文件、操作其他软件的超级助手。

它不需要你通过 API 喂给它数据,而是直接像你一样「看」着 Excel 表格、「听」着电话录音,同时「读」懂屏幕上的邮件,并实时做出决策。

这就是 Elorian 试图构建的未来。

资本的逻辑
为「血统」买单

5000 万美元的种子轮融资,在几年前听起来像是天方夜谭,但在今天的 AI 泡沫中,这似乎成了顶级团队的「入场费」。

正在与 Elorian 洽谈领投的 Striker Venture Partners,本身也是一家极具话题性的新锐基金。

其创始人 Max Gazor 曾是老牌风投 CRV 的合伙人,以眼光毒辣著称。

他在去年 10 月刚刚自立门户,Elorian 很可能是该基金成立后的首批标志性赌注之一。

对于 Max Gazor 这样的投资人来说,他们赌的不仅仅是技术路径,更是「谷歌 DeepMind + 苹果」这种稀缺的基因组合。

谷歌提供了大规模训练基础设施的经验,而苹果则有着将 AI 落地到具体产品的务实文化。

Elorian 的出现,也折射出大模型战场的转移。

第一阶段的战争是关于「文本生成」,OpenAI 凭借 ChatGPT 拔得头筹;

第二阶段的战争则是关于「多模态理解」和「物理世界交互」。

在这个新战场上,无论是 Gemini 还是 GPT,都在疯狂补课视觉能力。

Elorian 作为一个初创公司,想要在巨头的夹缝中生存,唯一的筹码就是技术上的代差,或者在垂直场景(如复杂的视觉 Agent)上做到极致。

在硅谷,每一个从巨头出走的顶级研究员,都怀揣着一个「反叛」的梦想:用更小的团队、更聚焦的资源,去颠覆老东家庞大而迟缓的官僚体系。

Andrew Dai 离开了效力 14 年的谷歌,Yinfei Yang 离开了发布 Apple 智能的苹果。

他们选择了一条最艰难的路——试图教会机器不仅「看见」世界,还要「看懂」世界。

这让人想起计算机视觉领域的一句老话:「摄像头只是眼睛,算法才是灵魂。」

而在 AI 的洪流中,真正稀缺的永远不是算力,而是那些能够透过数据的迷雾,看清未来方向的眼睛。

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/24 2:46:43

AI如何重构现代工作流开发?快马平台实战解析

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 使用快马平台的Kimi-K2模型,生成一个电商订单处理工作流系统。要求包含:1.订单自动审核逻辑(金额>5000需人工复核)2.库存检查与扣…

作者头像 李华
网站建设 2026/2/13 22:14:27

PLATFORMIO实战应用案例分享

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个PLATFORMIO实战项目,包含完整的功能实现和部署方案。点击项目生成按钮,等待项目生成完整后预览效果 PLATFORMIO实战应用案例分享 最近在做一个物联…

作者头像 李华
网站建设 2026/2/24 16:27:01

零基础教程:CentOS7安装Docker的5个常见错误及解决

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个交互式Docker安装问题排查工具,功能包括:1. 常见错误代码识别 2. 自动诊断系统环境 3. 分步骤修复建议 4. 日志分析功能 5. 一键回滚机制。要求界面…

作者头像 李华
网站建设 2026/2/21 5:27:59

API测试左移的核心价值与实施框架

‌一、核心定义:左移不是提前测试,而是质量内建‌API测试左移(Shift-Left API Testing)的本质,是将质量保障活动从传统的“开发完成后测试”模式,重构为“开发过程中内建质量”的系统性工程。它并非简单地将…

作者头像 李华
网站建设 2026/2/26 17:37:51

‌从监控到告警:API测试闭环

一、API测试闭环是现代测试体系的“神经中枢”‌在微服务与DevOps主导的软件交付体系中,‌API测试已从“功能验证”升级为“系统健康度的实时感知引擎”‌。 一个完整的API测试闭环,不是简单的“执行用例→报告结果”,而是‌监控→告警→定位…

作者头像 李华
网站建设 2026/2/25 19:40:57

LIBWEBKIT2GTK-4.1-0入门指南:从零开始学网页渲染

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个入门级教程应用,逐步引导用户学习如何使用LIBWEBKIT2GTK-4.1-0进行基本的网页渲染。应用应包含交互式示例和实时代码编辑器,允许用户修改代码并立即…

作者头像 李华