news 2026/1/18 7:47:26

震惊!AI开发者的“真香“定律:20%的LLM调用如何拯救80%的业务逻辑,小白程序员必看!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
震惊!AI开发者的“真香“定律:20%的LLM调用如何拯救80%的业务逻辑,小白程序员必看!

AI 最终回归生产力,而不是追逐技术热点。

作为Agent开发者,经历从“追逐Agent技术热点”转向“关注可靠性、稳定性和 ROI(投资回报率)”时,说明已经进入了生产级的思考阶段。

从2025年上半年开始,自己就开始学习和实践AI氛围编程和AI Agent开发。

从TREA到Course,再到Claude。通过AI编程,开发了各种各样的工具,有自己的博客网站、AI翻译、笔记系统、AI聊天工具等等。

从LangGraph、AutoGen、CrewAI,再到Langchain,最后又回归到LangGraph,通过实践这些智能体框架,开发了各种各样的应用,也对MCP、Funtioncall等工具有所了解。 如:Agentic RAG、网页制作、AI搜索引擎、AI自媒体创作、AI论文研究等。

经历了这么多,也确实体会到AI和智能体的强大,但是也发现AI并不是万能的,并不是所有的问题或任务,AI都能很好地解决,甚至越简单的问题,AI越容易翻车。

要想让解决实际问题或准确的完成任务,不要为了使用智能体而使用智能体。

在使用智能体解决问题或任务时,你应该思考两个问题?

一是该问题或任务,通过传统代码是否无法解决,是否只有通过智能体才能解决。

二是该问题或任务引入智能体,效率、质量、效果是否能产生质的变化,而不是只是20-50%的提升。

很多开发者之所以觉得智能体不稳定,是因为他们用“灵活但不可控”的框架去解决“需要高度确定性”的任务。大模型是昂贵且具有随机性的资源,我们要把它用在刀刃上。

以下是一个简单的判断逻辑:

判断维度使用传统代码/简单 Prompt (非 Agent)使用 AI Agent (复杂架构)
逻辑路径路径固定,IF-ELSE 就能走通。 要求100%确定性流程路径不确定,需要根据中间结果动态调整。
工具依赖不需要外部工具,或只用 1 个工具。需要组合使用多个工具(搜索、查库、改写)。
容错要求错了就报错,人来改。需要具备自我纠错和反思(Self-reflection)能力。
提升幅度仅提升 20%-50% 的搬砖效率。质变:解决以前程序完全跑不通的模糊问题。

作为 AI Agent 开发人员,我建议可以尝试这种“混合动力”架构:

第一层:确定性骨架。使用普通的编程逻辑(如 Fast API, Python 函数)来控制流程的开始、结束和关键分支。

第二层:智能插件。在骨架中,需要“理解语义”、“总结长文”、“情感判断”的地方,安插 LLM 调用,LLM作为组件进行调用。这是一个非常好,也比较常见的思路。兼顾确定性,又能按需发挥LLM的优势。

第三层:局部 Agent。只在最需要灵活性、无法穷举逻辑的小环节(如:模糊指令拆解),才启动一个小规模的 ReAct 循环。

不要为了 20% 的灵活性,承担了 80% 的不确定性,而是用 20% 的 LLM 灵性,去点亮 80% 的确定性业务逻辑。这样开发出来的产品,才是用户敢用、老板敢投、你能掌控的真正商业级应用。

结合上述的讨论,如果兼具受控和灵活性,个人认为最好的智能体框架应该是LangGraph,之所以被认为是目前最进阶的框架,是因为它在哲学层面上回归了计算机科学的本质:状态机(State Machine)。

LangGraph 的优势归纳为三个维度的“完美平衡”:

1.流程的“确定性”:给野马套上缰绳。在传统的 AgentExecutor 中,把工具交给模型后,只能祈祷它别跑偏。而在 LangGraph 中,通过 Nodes(节点)和 Edges(边)定义流程。可以规定,节点 A 执行完必须经过校验节点 B,校验不通过强制回滚到 A。同时,流程不再是不可知的,而是一张清清楚楚的流程图。这种确定性是商业软件(如金融、医疗、法律)敢于落地的前提。

2.LLM 作为“高阶组件”:按需调用智能。在 LangGraph 架构下,不再是“为了用模型而用模型”,而是把模型看作一种特殊的算力资源,比如在流程最后负责把枯燥的运行结果润色成人类语言。每一处调用都目标明确,不仅稳定,而且节省 Token,降低延迟。

3.智能体的“灵活性”:局部爆发智能。LangGraph 并不排斥真正的 Agent 行为。它支持“循环(Cycles)”,这让它可以实现真正的 ReAct。

传统流程自动化 ,坚硬但死板。纯智能体, 聪明但疯狂。LangGraph,有逻辑的聪明。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/15 16:17:16

《俄罗斯方块》为何让人停不下来?——从认知心理学、神经科学到游戏设计的深度解析

摘要: 本文系统剖析经典游戏《俄罗斯方块》(Tetris)为何能跨越40年仍具强大吸引力。文章从认知负荷理论、心流模型、蔡格尼克效应、多巴胺反馈机制、视觉工作记忆、空间推理训练等心理学与神经科学视角出发,结合游戏机制设计、难度…

作者头像 李华
网站建设 2026/1/16 3:56:55

C++函数与string对象、array对象及递归详解

C函数与string对象、array对象及递归详解 一、string对象的数组操作 string对象比C风格字符串更灵活&#xff0c;可以像结构体一样进行赋值和传递。以下示例展示了string数组的用法&#xff1a; #include <iostream> #include <string> using namespace std;const …

作者头像 李华
网站建设 2026/1/14 15:42:28

Miniconda-Python3.9环境下实现PyTorch模型冷启动优化

Miniconda-Python3.9环境下实现PyTorch模型冷启动优化 在部署深度学习服务时&#xff0c;你是否遇到过这样的场景&#xff1a;系统重启后第一个用户请求响应特别慢&#xff0c;甚至超时&#xff1f;日志显示&#xff0c;并非代码逻辑问题&#xff0c;而是模型加载、依赖初始化等…

作者头像 李华
网站建设 2026/1/14 19:21:28

硬核对决:TruthfulRAG如何运用知识图谱化解RAG知识冲突?

&#x1f4cc; RAG系统的困境 问题的根源&#xff1a;知识冲突 RAG&#xff08;检索增强生成&#xff09;系统中&#xff1a;当外部检索到的知识与模型内部参数化知识不一致时&#xff0c;LLM往往会陷入不知所措。 知识冲突示意图 Figure 1: 知识冲突示意图。现有方法在toke…

作者头像 李华
网站建设 2026/1/11 23:16:58

SpringBoot代码集

一、获取Spring容器对象1.1 实现BeanFactoryAware接口实现BeanFactoryAware接口&#xff0c;然后重写setBeanFactory方法&#xff0c;就能从该方法中获取到Spring容器对象。Service public class PersonService implements BeanFactoryAware {private BeanFactory beanFactory;…

作者头像 李华
网站建设 2026/1/14 11:11:36

2025最新!8个AI论文平台测评:本科生写论文还能这么快?

2025最新&#xff01;8个AI论文平台测评&#xff1a;本科生写论文还能这么快&#xff1f; 2025年AI论文平台测评&#xff1a;为何需要这份榜单&#xff1f; 随着人工智能技术的不断进步&#xff0c;越来越多的本科生开始借助AI工具提升论文写作效率。然而&#xff0c;面对市场上…

作者头像 李华