42.llama_index-说明-平芜编程栈

内容参考于：图灵AI大模型全栈

langchain去搞Agent了对RAG兼容性太差了，可以说没有RAG的功能了，这里停止更新langchain，接下来开始写新的框架llama_index，它好使

LLama_index框架

api文档地址:https://developers.llamaindex.ai/python/framework-api-reference/
官网地址: https://developers.llamaindex.ai/python/framework/getting_started/starter_example/
项目地址:https://github.com/run-llama/llama_index
LlamaHub (开源的“插件市场): https://llamahub.ai/

llamaIndex最开始的名字叫GPT Index，它是目前大语言模型（LLM）最核心的数据框架之一，它解决了RAG问题

llamaIndex发展史

2022.11 项目启动：Jerry Liu 提交首版代码，定名 GPT Index，核心是树状索引（Tree Index），用于突破 GPT-3 上下文限制，后续补充列表、关键词两类索引结构。
2022.12 能力补全：新增 Embedding 与向量存储支持，接入 Notion、Slack、Google Drive 等首批数据源，初步形成完整 RAG 基础链路。
2023.01 社区破圈：登上 GitHub Trending，在开发者群体中快速获得关注度。
2023.02 生态起步：联合 Jesse Zhang 上线 LlamaHub 插件仓库，通过社区活动征集到 50+ 数据加载器，搭建起插件生态雏形。
2023.03 品牌与商业化落地：同步完成两件大事 —— 一是正式更名 LlamaIndex，规避品牌冲突并锚定通用 LLM 数据框架定位，同时快速适配 ChatGPT API 与官方插件；二是完成 Greylock 领投的 850 万美元种子轮融资，联合 Simon Suo 成立公司，转向全职商业化运作。
2024 能力全面升级：从基础向量检索拓展至高级 RAG、多智能体系统、全链路评估体系，跻身 RAG 领域主流框架行列。
2025 企业级架构重构：推出 Workflows 异步流程编排、LlamaParse 高精度文档解析、LlamaAgents 多智能体调度等核心能力，战略重心转向 Agentic RAG 与生产级文档自动化。
2026 至今产品矩阵深化：持续迭代 LlamaParse v2、LlamaSplit、LlamaSheets 等产品，强化多模态解析、企业级部署与生态建设，成为生产级 RAG 与智能体应用的核心基础设施。

LLamaIndex架构图

通过架构图可以看出，
数据接入层：LLamaIndex可以接受本地文件、网页、数据库、api、云存储、第三方工具
摄取管道层：它还可以文本分割（各种格式的文档），元数据的提取，嵌入模型（向量模型，把切分好的文本转成向量）
缓存层：把向量数据保存到内存数据库，它支持很多数据库
Node层：在LLamaIndex中切片之后的数据被称为节点（Node），切片之后的数据分三种纯文本数据（Text）、图片数据（Image）、索引数据（index，切片之后的结果）
索引层：在存储向量数据时，不一股脑全存起来，要有一个数据格式，比如给向量搞一个分类，比如语文向量、数学向量、物理向量它们都单独放一个地方，比如找语文向量就去专门存放语文向量的地方找
存储层：它有向量存储、文档存储、索引或图存储，这个是保存到硬盘上持久化
检索层：检索器、重排器
查询引擎层：查询引擎（把检索的功能封装到一起），对话引擎
响应合成层：比如现在检索出3个文档，现在做的事情是3个文档做拼接，拼接的时候会存在数据不完整，这时让大模型对3个文档分别进行优化，然后在进行拼接
Agent层：智能体，这里后面会专门写
Workflow层：工作流
LLM层：支持的大模型

基于范围的for循环

在上面的语法格式中Type declaration表示遍历声明，在遍历过程中，当前被遍历导的元素会被存储到声明的变量declaration中。expression是要遍历的对象，它可以是表达式、容器、数组、初始化列表等。如下代码： #include <iostre…

李华

c++复习自存

static 静态变量用途一、函数内部 static 局部变量核心特点存储在全局静态存储区，不是栈；程序启动分配内存、程序结束才销毁只初始化1次，首次进入函数执行初始化，后续调用跳过初始化作用域仍仅限当前函数，外部无…

李华

字节豆包AI编程助手扩展：深度解析其代码能力边界与实战表现

字节豆包AI编程助手扩展：深度解析其代码能力边界与实战表现说实话，当我第一次听说字节跳动要把豆包从单纯的“智能对话助手”彻底转型为“全栈AI编程伴侣”时，我是持保留态度的。毕竟，市面上已经躺着一堆成熟的IDE插件和独立AI编程…

李华

Go 驱动工程化后端服务：并发不是越多越好

Go 驱动工程化后端服务：并发不是越多越好一、AI 后端的瓶颈常在等待和排队 Go 很适合写 AI 应用后端：并发模型清晰，网络服务成熟，部署成本低。但一接入模型推理、向量检索、对象存储和外部 API，就会发现瓶颈不只在代…

李华

AI 辅助：前端性能自动诊断：从 RUM 指标到可执行优化建议

AI 辅助：前端性能自动诊断：从 RUM 指标到可执行优化建议一、性能诊断不能停在“LCP 很慢” 前端性能监控接入后，很多报表只会告诉你 LCP、CLS、INP 不达标。问题是，知道 LCP 慢不等于知道怎么改。是首屏图片太大，接口太…

李华

AI 工具测评方法：别只看生成效果，要看日常摩擦

AI 工具测评方法：别只看生成效果，要看日常摩擦一、生活化 AI 工具测评要看完整体验测评 AI 工具时，很多文章只比较生成效果：谁写得更像人，谁回答更长，谁更会总结。但对普通用户来说，工具是否好…