内容参考于:图灵AI大模型全栈
langchain去搞Agent了对RAG兼容性太差了,可以说没有RAG的功能了,这里停止更新langchain,接下来开始写新的框架llama_index,它好使
LLama_index框架
api文档地址:https://developers.llamaindex.ai/python/framework-api-reference/
官网地址: https://developers.llamaindex.ai/python/framework/getting_started/starter_example/
项目地址:https://github.com/run-llama/llama_index
LlamaHub (开源的“插件市场): https://llamahub.ai/
llamaIndex最开始的名字叫GPT Index,它是目前大语言模型(LLM)最核心的数据框架之一,它解决了RAG问题
llamaIndex发展史
2022.11 项目启动:Jerry Liu 提交首版代码,定名 GPT Index,核心是树状索引(Tree Index),用于突破 GPT-3 上下文限制,后续补充列表、关键词两类索引结构。
2022.12 能力补全:新增 Embedding 与向量存储支持,接入 Notion、Slack、Google Drive 等首批数据源,初步形成完整 RAG 基础链路。
2023.01 社区破圈:登上 GitHub Trending,在开发者群体中快速获得关注度。
2023.02 生态起步:联合 Jesse Zhang 上线 LlamaHub 插件仓库,通过社区活动征集到 50+ 数据加载器,搭建起插件生态雏形。
2023.03 品牌与商业化落地:同步完成两件大事 —— 一是正式更名 LlamaIndex,规避品牌冲突并锚定通用 LLM 数据框架定位,同时快速适配 ChatGPT API 与官方插件;二是完成 Greylock 领投的 850 万美元种子轮融资,联合 Simon Suo 成立公司,转向全职商业化运作。
2024 能力全面升级:从基础向量检索拓展至高级 RAG、多智能体系统、全链路评估体系,跻身 RAG 领域主流框架行列。
2025 企业级架构重构:推出 Workflows 异步流程编排、LlamaParse 高精度文档解析、LlamaAgents 多智能体调度等核心能力,战略重心转向 Agentic RAG 与生产级文档自动化。
2026 至今 产品矩阵深化:持续迭代 LlamaParse v2、LlamaSplit、LlamaSheets 等产品,强化多模态解析、企业级部署与生态建设,成为生产级 RAG 与智能体应用的核心基础设施。
LLamaIndex架构图
通过架构图可以看出,
数据接入层:LLamaIndex可以接受本地文件、网页、数据库、api、云存储、第三方工具
摄取管道层:它还可以文本分割(各种格式的文档),元数据的提取,嵌入模型(向量模型,把切分好的文本转成向量)
缓存层:把向量数据保存到内存数据库,它支持很多数据库
Node层:在LLamaIndex中切片之后的数据被称为节点(Node),切片之后的数据分三种 纯文本数据(Text)、图片数据(Image)、索引数据(index,切片之后的结果)
索引层:在存储向量数据时,不一股脑全存起来,要有一个数据格式,比如给向量搞一个分类,比如语文向量、数学向量、物理向量它们都单独放一个地方,比如找语文向量就去专门存放语文向量的地方找
存储层:它有向量存储、文档存储、索引或图存储,这个是保存到硬盘上持久化
检索层:检索器、重排器
查询引擎层:查询引擎(把检索的功能封装到一起),对话引擎
响应合成层:比如现在检索出3个文档,现在做的事情是3个文档做拼接,拼接的时候会存在数据不完整,这时让大模型对3个文档分别进行优化,然后在进行拼接
Agent层:智能体,这里后面会专门写
Workflow层:工作流
LLM层:支持的大模型