news 2026/7/2 2:17:02

42.llama_index-说明

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
42.llama_index-说明

内容参考于:图灵AI大模型全栈

langchain去搞Agent了对RAG兼容性太差了,可以说没有RAG的功能了,这里停止更新langchain,接下来开始写新的框架llama_index,它好使

LLama_index框架

api文档地址:https://developers.llamaindex.ai/python/framework-api-reference/

官网地址: https://developers.llamaindex.ai/python/framework/getting_started/starter_example/

项目地址:https://github.com/run-llama/llama_index

LlamaHub (开源的“插件市场): https://llamahub.ai/

llamaIndex最开始的名字叫GPT Index,它是目前大语言模型(LLM)最核心的数据框架之一,它解决了RAG问题

llamaIndex发展史

2022.11 项目启动:Jerry Liu 提交首版代码,定名 GPT Index,核心是树状索引(Tree Index),用于突破 GPT-3 上下文限制,后续补充列表、关键词两类索引结构。

2022.12 能力补全:新增 Embedding 与向量存储支持,接入 Notion、Slack、Google Drive 等首批数据源,初步形成完整 RAG 基础链路。

2023.01 社区破圈:登上 GitHub Trending,在开发者群体中快速获得关注度。

2023.02 生态起步:联合 Jesse Zhang 上线 LlamaHub 插件仓库,通过社区活动征集到 50+ 数据加载器,搭建起插件生态雏形。

2023.03 品牌与商业化落地:同步完成两件大事 —— 一是正式更名 LlamaIndex,规避品牌冲突并锚定通用 LLM 数据框架定位,同时快速适配 ChatGPT API 与官方插件;二是完成 Greylock 领投的 850 万美元种子轮融资,联合 Simon Suo 成立公司,转向全职商业化运作。

2024 能力全面升级:从基础向量检索拓展至高级 RAG、多智能体系统、全链路评估体系,跻身 RAG 领域主流框架行列。

2025 企业级架构重构:推出 Workflows 异步流程编排、LlamaParse 高精度文档解析、LlamaAgents 多智能体调度等核心能力,战略重心转向 Agentic RAG 与生产级文档自动化。

2026 至今 产品矩阵深化:持续迭代 LlamaParse v2、LlamaSplit、LlamaSheets 等产品,强化多模态解析、企业级部署与生态建设,成为生产级 RAG 与智能体应用的核心基础设施。

LLamaIndex架构图

通过架构图可以看出,

数据接入层:LLamaIndex可以接受本地文件、网页、数据库、api、云存储、第三方工具

摄取管道层:它还可以文本分割(各种格式的文档),元数据的提取,嵌入模型(向量模型,把切分好的文本转成向量)

缓存层:把向量数据保存到内存数据库,它支持很多数据库

Node层:在LLamaIndex中切片之后的数据被称为节点(Node),切片之后的数据分三种 纯文本数据(Text)、图片数据(Image)、索引数据(index,切片之后的结果)

索引层:在存储向量数据时,不一股脑全存起来,要有一个数据格式,比如给向量搞一个分类,比如语文向量、数学向量、物理向量它们都单独放一个地方,比如找语文向量就去专门存放语文向量的地方找

存储层:它有向量存储、文档存储、索引或图存储,这个是保存到硬盘上持久化

检索层:检索器、重排器

查询引擎层:查询引擎(把检索的功能封装到一起),对话引擎

响应合成层:比如现在检索出3个文档,现在做的事情是3个文档做拼接,拼接的时候会存在数据不完整,这时让大模型对3个文档分别进行优化,然后在进行拼接

Agent层:智能体,这里后面会专门写

Workflow层:工作流

LLM层:支持的大模型


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 2:16:26

基于范围的for循环

在上面的语法格式中Type declaration表示遍历声明&#xff0c;在遍历过程中&#xff0c;当前被遍历导的元素会被存储到声明的变量declaration中。expression是要遍历的对象&#xff0c;它可以是表达式、容器、数组、初始化列表等。 如下代码&#xff1a; #include <iostre…

作者头像 李华
网站建设 2026/7/2 2:13:53

c++复习自存

static 静态变量用途 一、函数内部 static 局部变量 核心特点 存储在全局静态存储区&#xff0c;不是栈&#xff1b;程序启动分配内存、程序结束才销毁只初始化1次&#xff0c;首次进入函数执行初始化&#xff0c;后续调用跳过初始化作用域仍仅限当前函数&#xff0c;外部无…

作者头像 李华
网站建设 2026/7/2 2:12:58

字节豆包AI编程助手扩展:深度解析其代码能力边界与实战表现

字节豆包AI编程助手扩展&#xff1a;深度解析其代码能力边界与实战表现说实话&#xff0c;当我第一次听说字节跳动要把豆包从单纯的“智能对话助手”彻底转型为“全栈AI编程伴侣”时&#xff0c;我是持保留态度的。毕竟&#xff0c;市面上已经躺着一堆成熟的IDE插件和独立AI编程…

作者头像 李华
网站建设 2026/7/2 2:07:36

Go 驱动 工程化 后端服务:并发不是越多越好

Go 驱动 工程化 后端服务&#xff1a;并发不是越多越好 一、AI 后端的瓶颈常在等待和排队 Go 很适合写 AI 应用后端&#xff1a;并发模型清晰&#xff0c;网络服务成熟&#xff0c;部署成本低。但一接入模型推理、向量检索、对象存储和外部 API&#xff0c;就会发现瓶颈不只在代…

作者头像 李华
网站建设 2026/7/2 2:07:28

AI 辅助:前端性能自动诊断:从 RUM 指标到可执行优化建议

AI 辅助&#xff1a;前端性能自动诊断&#xff1a;从 RUM 指标到可执行优化建议一、性能诊断不能停在“LCP 很慢” 前端性能监控接入后&#xff0c;很多报表只会告诉你 LCP、CLS、INP 不达标。问题是&#xff0c;知道 LCP 慢不等于知道怎么改。是首屏图片太大&#xff0c;接口太…

作者头像 李华
网站建设 2026/7/2 2:05:10

AI 工具测评方法:别只看生成效果,要看日常摩擦

AI 工具测评方法&#xff1a;别只看生成效果&#xff0c;要看日常摩擦 一、生活化 AI 工具测评要看完整体验 测评 AI 工具时&#xff0c;很多文章只比较生成效果&#xff1a;谁写得更像人&#xff0c;谁回答更长&#xff0c;谁更会总结。但对普通用户来说&#xff0c;工具是否好…

作者头像 李华