news 2026/5/28 15:27:49

AI大模型时代,谈谈大模型方向的择业建议!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI大模型时代,谈谈大模型方向的择业建议!

在随着DeepSeek、Qwen、GLM等基座模型的崛起,人才待遇飙升、招聘逻辑重写、AGI信仰回归,基座研发成为薪酬与成长的绝对洼地,而错过窗口的传统算法岗正被时代加速淘汰。本文总结25年的关键变化,并给出校招与转岗的核心建议,希望对大家有所帮助。

自春节Deepseek R1发布以来,在短短的半年内,国内以纯文本大规模MoE为代表的推理模型快速进步,国产开源模型稳稳的站住了全球来源第一,就算到今天,开源上还是遥遥领先,并且倒逼openAI交了gpt-oss这个作业。 国内DeepSeek,GLM,Kimi,Qwen取得了巨大的影响力,靠万亿MoE稳稳地坐在了牌桌上。

以上,彻底改变了国产模型一直落后一直追赶的局面,开始在时间和空间上局部引领。行业格局开始分化,顶级玩家还是坚信AGI,玩不下去的玩家开始打退堂鼓去搞B端落地了,为了活下去彻底放弃了AGI信仰。

去年初还是下面这个状态:

“国内的基座团队目前还是为了老板的梦想或者FOMO买单。对于大伙儿最好的局面是,一直有开源,一直有openai画更大的饼,一直落后,一直都可以追赶, 这样就永远有饭吃,老板永远掏钱。这一跟链条,缺了哪个,都玩不下去。以上是比较悲观的观点,但乐观点看,技术突破往往由少数几个人引领, 大家合力推进完成,大模型赛道玩家,只有中美两国的玩家才玩得起了,我们人多,彩票多,而且qwen,deepseek已经在引领开源社区进步了, 乐观点看,还是非常有希望完成各位老板的梦想的。”

果然应了那句话,悲观者正确,乐观者前行。基于以上,25年底,发生的显著变化是:

1.从业者的待遇

大家变自信了,核心开发者的薪酬开始水涨船高,最有代表性的seed,当一些厂还在千金买马骨,把招聘了一个吉祥物当成PR素材猛猛宣传的时候,字节直接年中一波期权增发大撒币,人均薪酬+xx万。这可是前所未有的老板舍得给牛马分钱的壮举,麦子熟了三千回,牛马分钱头一回。

由于招聘方卷起来了,现在基座开发的应届生,薪酬没有低于100万的,如果有,那就是你要少了。

2.招聘方更愿意为潜力买单

除非你是行业知名的技术大牛,否则竞争力大概是不如简历发光的应届生的。

首先,大模型就不存在什么3年经验,22年3月到24年10月,大部分厂还在玩dense泥巴。这些经验在今天来来是不值什么钱的。招聘方只愿意为万亿MoE,Agent,Omni买单,这些方向出成绩也就最近12个月的事情。然后我们再看今天,nano banana pro和gemini 3 pro又搞出了技术代差,效果遥遥领先,openAI都有点追不上了。这时候你说3年经验有什么用,不如一个新脑子。

3.AGI的核心是G

在大模型刚开始搞得时候,大家还逼逼赖赖要找场景,要能落地。信了这个的都掉坑了,大家可以去看看梁文峰的采访,这就是认知的差距。搞什么落地,那都是玩泥巴,那跟以前被淘汰的接单子的AI厂有什么区别。接单子天花板低到爆,有梦想就要搞通用人工智能,一定要通用,冲击千亿美金估值。

除了厂长的认知差距,从业者的认知差距也很大。在22年有大量不相信AGI的算法工程师,散落在大厂的搜索,交互,内容理解,NLP中心等。他们的解法是在各个业务板块里,开个闪光logo入口,内接一个多轮助手,希望帮用户用自然语言买东西,解答领域问题,生成个xx攻略,在这些岗位上搞大模型的,没有吃到什么红利。整体还是互联网模式,除了见顶后压力越来越大,还有一个致命的问题。随着AGI推进,业务的大模型大概率也是直接接入基座,核心的工作量在着写prompt和上下文工程上,除了有精力雕花RL的,大部分人的简历都千篇一律。雕花RL的经验也没什么人买单,都过拟合数据玩泥巴。

当然,有时候也不是他们不相信。更多的是在行业混沌期的认知和勇气都不到位,抱着求稳的心态先干着。没想到错过了窗口期就再也进不去了。我也相信有很多很有潜力,很优秀的算法工程师,在为公司某一个APP点位提升一点CTR,转化率。在绞尽脑汁拼命降低XX场景的人力成本。他们也是优秀和聪明的,但人只能赚到认知内的钱。

现在回头看看2024年底写的文章,观点还是不变,有能力,一定要去做基座研发,去核心的基座团队。

基座团队相当于薅公司大羊毛,持续从其他业务上吸血,薪资和发展空间都非常好。而且也不需要考虑自己养活自己,没那么在意性价比。

能一直投入基座研发的公司,后面都有业务印钞机支撑,过往公司分享红利的方式只能通过RSU,期权变现,吃估值提升的红利。而现在,你有一个机会,从公司的业务红利里分蛋糕。

另外一个很重要的点是,做基座很容易做出影响力,在聚光灯下,公司搭台子,你来唱戏。弄的不错的话,可以给自己的影响力和credit加大分,直接去竞争对手家变现。

应用方向,如果有降本增效或者生产力工具的方向也可以考虑。谨慎考虑C端的各种XX助手,尤其是面向C端的,大概率生命周期短于1年。非常不适合应届生成长,大概率一年后要被动接受变化。

应用落地方向虽然没有那么大的光环,影响力和吃红利的机会,且大概率会被基座的能力水平扩展逐渐替代,算法也就是写写prompt。

但奈何不住是应用的需求很大,目前的好处是有大量的业务团队愿意试错,各个业务老板虽然没有财力和能力投入核心基座的竞争。

但各个业务线都有大量的老板在忽悠他们更大的老板,就想着在自己的业务上做个“行业”模型,拿“行业”或者“应用”模型给自己也吹个牛。

虽然“行业”模型在内行看起来就是个挺丢人的笑话,彻头彻尾的逆AGI行为。但是耐不住下面有讨好老板的人,你可以在这些大量的试错中轻松拿到一个岗位,混口饭吃。

其实,真论混饭吃,远远不如基座的训练岗位,这是一个门槛极高且可以容纳混子的岗位,只要你能面过,就有超级好的infra和数据团队来支持,你每天只要看看论文,提提需求,操盘实验,凝练下认知就好了。

等你跳槽的时候,对面的公司对你的滤镜完全来自于你现在的公司的成功与否,所以只要选对团队,大概率就可以从平台上借势和吃红利。

但这一切的前提是,你要卷进去,拿到入场券。

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

L5阶段:专题集丨特训篇 【录播课】


四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 3:19:58

高校科研团队如何用Kotaemon做学术知识图谱问答?

高校科研团队如何用Kotaemon做学术知识图谱问答? 在人工智能加速演进的今天,高校科研人员正面临一个看似矛盾的现象:获取论文比以往任何时候都更容易,但从中提炼有效知识却越来越难。每天新增数以千计的预印本、项目文档和会议摘要…

作者头像 李华
网站建设 2026/5/28 0:36:35

Kotaemon更新日志:最新v1.2版本带来哪些关键升级?

Kotaemon v1.2:如何构建真正可用的生产级智能代理? 在AI对话系统从“能说”迈向“会做”的今天,一个核心问题日益凸显:我们能否让大模型不只是复述知识,而是真正理解上下文、调用工具、完成任务?许多团队尝…

作者头像 李华
网站建设 2026/5/27 16:49:39

超越MSE与交叉熵:深度解析损失函数的动态本质与高阶设计

好的,基于您提供的随机种子 1766016000072 和详细要求,我将为您创作一篇兼具深度与新颖性的技术文章。本文将聚焦于损失函数的“动态”与“自定义”层面,超越常见的分类与回归介绍,探讨其在复杂优化场景下的核心作用。 # 超越MSE与…

作者头像 李华
网站建设 2026/5/28 5:50:09

45、WinFx UI编程与功能概述

WinFx UI编程与功能概述 1. WinFx简介 WinFx为Windows用户界面应用程序的开发带来了许多新概念和新方法。它在针对显示设备和图形渲染方面采用了全新的方式,引入了多种编程UI元素的新途径,还提供了一种用于指定UI应用程序的声明性语言。 1.1 突破基于像素的编程模型 当前…

作者头像 李华