news 2026/7/5 2:50:51

公司裁员后,我花了20天做出了第一个RAG项目

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
公司裁员后,我花了20天做出了第一个RAG项目

前言

直到2025年初,我还觉得AI就是ChatGPT。

无非是一个更聪明的搜索引擎。

真正开始研究AI应用开发后,我发现远远没有那么简单。

那段时间,我每天都在刷招聘网站。

看AI应用开发岗位。

看大模型相关岗位。

看各种技术交流群里的讨论。

然后我发现一个词出现频率特别高:

RAG。

几乎所有AI应用开发岗位都会提到它。

最开始我以为:

RAG一定是什么复杂算法。

甚至以为要研究模型训练、深度学习才能搞懂。

后来真正做完自己的第一个RAG项目后才发现:

RAG并没有想象中那么神秘。

它本质上是在解决一个非常现实的问题:

如何让大模型拥有企业自己的知识。

而这也是我AI转型过程中完成的第一个完整项目。


为什么我选择先做RAG

刚开始学习AI的时候。

我也很迷茫。

因为网上能看到的东西太多了。

有人在讲:

  • Agent
  • Workflow
  • MCP
  • Function Calling

有人在讲:

  • LangChain
  • Spring AI
  • Dify
  • FastGPT

还有人在讲:

  • 微调
  • 蒸馏
  • 推理优化

看得越多。

反而越不知道从哪里开始。

后来我做了一件很简单的事:

去看招聘网站。

看看企业到底在招什么人。

结果发现:

大部分AI应用开发岗位都会提到几个关键词:

  • RAG
  • Agent
  • AI助手
  • 企业知识库

而在这些方向里。

RAG又是最容易落地,也是应用最成熟的场景之一。

于是我决定:

先别研究那些复杂概念。

先做出一个真正能运行的RAG项目。


我以为最难的是技术

真正开始做项目之前。

我以为最大的挑战会是:

  • 大模型
  • 向量数据库
  • AI算法

后来发现完全不是。

最难的其实是:

信息太多。

概念太多。

框架太多。

每天打开B站。

打开公众号。

打开技术社区。

都能看到各种新名词。

有时候看了一天视频。

反而越来越迷茫。

后来我给自己定了一条原则:

不要一直学。

边学边做。

不会就查。

查完就写代码。

事实证明。

这是我整个转型过程中做得最正确的一件事。


我的20天学习路线

很多朋友问:

RAG到底学了多久?

其实严格来说。

从开始接触到项目跑通。

大概用了20天左右。

当然这20天并不是全天投入。

而是边学习边开发。

大概经历了几个阶段。

第一阶段:学会调用模型

最开始甚至不会调用API。

只知道使用ChatGPT网页版。

后来开始学习:

  • API调用
  • Message结构
  • Prompt设计
  • Token概念

写出了自己的第一个AI聊天程序。


第二阶段:接触AI开发框架

聊天程序跑通之后。

开始接触:

  • Spring AI
  • LangChain4j

这些AI开发框架。

第一次意识到:

原来大模型并不只是聊天。

还可以接入:

  • 知识库
  • 搜索
  • 工作流
  • 业务系统

开始有了AI应用开发的概念。


第三阶段:接触向量数据库

然后开始接触:

  • Embedding
  • Milvus
  • 向量检索

这时候才发现:

企业知识库的核心并不是大模型。

而是数据。

如何让大模型找到正确的数据。

远比选择哪个模型更重要。


第四阶段:完成第一个RAG项目

最终完成:

  • 文档上传
  • 文档解析
  • 文本切分
  • 向量化
  • 相似度检索
  • 智能问答

整个链路打通。

虽然只是第一版。

但它已经能够真正回答知识库中的问题。

这也是我第一个真正意义上的AI应用项目。


做完之后我最大的收获

完成项目后。

我最大的感受其实不是:

我学会了RAG。

而是:

AI并没有想象中那么遥不可及。

很多人看到:

  • Agent
  • RAG
  • 大模型

会觉得这是一个非常高门槛的领域。

但真正开始做之后会发现:

对于传统开发者来说。

很多能力其实是共通的。

例如:

  • 系统设计
  • 数据处理
  • 接口开发
  • 架构设计

这些经验并没有失效。

只是服务的对象发生了变化。

从传统业务系统。

变成了AI系统。


AI应用开发到底在做什么

在做这个项目之前。

我一直以为:

AI开发就是研究模型。

做完之后我才发现。

企业里的AI应用开发更多是在解决工程问题。

例如:

  • 如何组织知识
  • 如何管理数据
  • 如何控制成本
  • 如何降低幻觉
  • 如何让系统稳定运行

而这些问题。

恰恰是传统开发者最容易发挥价值的地方。

这也是为什么我越来越坚定地认为:

AI应用开发会成为未来几年非常重要的方向之一。


写在最后

这一篇更多是在记录我的学习过程。

而不是讨论具体技术实现。

如果说这一篇是在回答:

“我是如何做出第一个RAG项目的?”

那么下一篇。

我会详细拆解:

“这个RAG项目到底是怎么实现的?”

包括:

  • 为什么采用 MySQL + Milvus 双存储设计
  • Chunk应该如何切分
  • 向量库如何设计
  • 检索策略如何优化
  • Prompt如何组装
  • 为什么第一版没有引入Rerank

以及整个项目的核心架构设计。

另外,在开发过程中我也一直在思考另一个问题:

对于Java开发者来说。

面对Spring AI、LangChain4j、Dify、FastGPT等越来越多的AI框架,到底应该如何选择?

Python生态如此强势。

Java开发者还有机会吗?

这些也是我后续准备持续探索的话题。


📖系列目录

  • 第1篇:30岁+、10年Java,我决定转向AI应用开发
  • 第2篇:公司裁员后,我花了20天做出了第一个RAG项目(本文)

如果这篇文章对你有帮助,欢迎点赞、收藏、关注,我会持续更新这个系列。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/5 2:50:14

【AI】深思:当编码被接管,为何“拍板”与“背锅”仍是人的主场?

导读:当AI把代码写得又快又好,工程师的价值坐标必须位移:核心壁垒从“编码能力”转向“价值决策”与“风险承担”。AI擅长计算“可能性”,人类则负责判定“必要性”并为之“买单”。掌握定义问题的权力,承担后果的勇气…

作者头像 李华
网站建设 2026/6/30 22:18:08

Magpie终极指南:15种超分辨率算法重塑Windows窗口放大体验

Magpie终极指南:15种超分辨率算法重塑Windows窗口放大体验 【免费下载链接】Magpie A general-purpose window upscaler for Windows 10/11. 项目地址: https://gitcode.com/gh_mirrors/mag/Magpie Magpie是一款革命性的Windows窗口放大工具,它通…

作者头像 李华
网站建设 2026/6/30 22:16:52

AI Weekly 6.22-6.28

本周 AI 快讯 | 1 分钟速览01 微信原生 AI 助手「小微」启动内测,一句话可生成小程序 :底座混合自研 WeLM 和 DeepSeek,支持语音和文字对话操控微信原生功能;14.32 亿月活产品首次嵌入 AI 助手;同周 QQ 邮箱推出 AI Ag…

作者头像 李华