7.2 RAG 基础:词嵌入 Embedding,RAG 流程
引言
在上一节中,我们了解了RAG(Retrieval-Augmented Generation)的基本概念和核心价值。要深入理解RAG的工作原理,我们需要掌握其核心技术基础——词嵌入(Embedding)和向量检索流程。
作为产品经理,虽然我们不需要深入掌握复杂的数学算法,但理解这些基础技术概念对于设计优秀的RAG产品至关重要。本节将用通俗易懂的方式,为您解析词嵌入技术的原理和RAG的完整工作流程。
词嵌入(Embedding)技术详解
什么是词嵌入?
词嵌入是一种将文本(单词、句子、文档)转换为数值向量的技术。这些向量能够在数学空间中表示文本的语义信息,使得语义相似的文本在向量空间中距离较近,语义不同的文本距离较远。