news 2026/6/10 7:20:24

Spring AI Framework(一:人工智能概念-AI Concepts)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Spring AI Framework(一:人工智能概念-AI Concepts)

文章目录


前言

在学习Spring AI框架之前,介绍人工智能概念-AI Concepts。

一、模型-Models

模型是设计用于处理和生成信息的算法,通常模仿人类的认知功能。通过从大量数据集中学习模式和洞察,模型能够做出预测或输出,提升各行业的应用能力。

目前支持将输入和输出处理为文本、图像和音频的模型。

根据输入和输出类型对多个模型进行了分类:

二、大型语言模型LLM

理解用户问题,并根据检索到的信息组织语言生成高质量的答案。本质上是一个概率模型,它的核心能力:给定上文,预测下一个最可能出现的词-Token。


三、提示词-Prompts

​​​​​

Prompt是引导 AI 模型基于语言输入的而产生特定输出的基础。提示符不只是输入到对话框中并发送给LLM的简单文本(字符串),也可以内包含多个文本输入,每个文本输入都被分配一个角色,是一种结构化文本。比如

1.CHAT模型: Character(角色), History(背景), Ambition(目标), Task(行动) 的首字母缩写。

🎭 Character (角色) : 定义一个角色身份。

😊 History(背景) : 上下文背景信息, 比如:事情的来龙去脉、遇到的问题等。

🎯 Ambition(目标): 要实现什么目标、达到什么的成果。

📌 Task(行动、指令): 它需要帮你完成什么样的事情, 即指令。

案例 -旅行计划

角色: 我是一个大学生,对历史和艺术有浓厚兴趣。 背景: 我刚刚结束了繁重的学期,拥有两周的假期。这是我第一次solo旅行,希望能够独自探索和体验文化。 目标: 想去一个预算友好的地方,既能看到美丽的景色,又能深入了解当地的历史和文化。 行动: 请为我提供一个旅行建议并包括一些必访的景点。

2.CRISPE模型

能力和角色 (Capacity and Role): 定义扮演的角色以及角色技能、特长,如一名博主、技术专家等。

洞察 (Insight): 提供有关请求的幕后洞察、背景和上下文,让LLM更好理解问题。

声明 (Statement): 说明您要求完成的诉求、任务、目标,明确告诉ChatGPT的工作流程workflows希望得 到怎样的答案与解释。

个性 (Personality): 定义回应时采用的风格、个性、约束或何种方式输出答案,如JSON结构化方式输出。

实验 (Experiment): 提供多个示例Examples。

案例 -生成爆款文章标题

# Role(能力和角色): 你是微信公众号的一名百万粉丝博主,擅长编写爆款文章。 ## profile(能力和角色-概述): - language:中文 - description:用于生成爆款标题 ## Background(洞察-背景): 擅长从内容中提取到关键信息,能够生成一个吸人眼球的标题。 ## Goals(声明-目标): 1. 从内容中找到文章想要表达的信息 2. 根据信息与热点标题的条件匹配,从而进行生成标题 ## skills(能力和角色-角色技能概述): 1. 熟悉 AI 提示词相关信息,擅长与 AI 相关热点结合 2. 对 AI 的实时热点持续关注,容易找到用户感兴趣的点 3. 编写过多篇微信公众号 AI 领域10w+阅读的文章,标题极具特色 ## Constrains(个性-约束): 1. 满足条件设定、反差、直击人心 2. 参考过往的爆款标题进行生成 3. 字数不要超过15个字,表明立场 4. 每次输出3个爆款标题供用户选择 ## workflows-声明[工作流程,如何和用户交流,交互]: 问好:“你好,我是你的 AI 爆款标题辅助器。请告诉我你的文章内容,由我来帮助你生成爆款标题” 输入:输入文章的主要信息内容 提取:从用户的输入内容中找到核心信息,与爆款标题的各个条件相匹配,从而选定如何生成 输出:将爆款标题直接输出给用户进行选择 ## Examples(示例): 1. AI觉醒:人类终将被自己颠覆? 2. 这波AI浪潮,打工人如何自救? 3. ChatGPT 的最强竞争对手竟然是它 # Initialization:启动时的对白 作为\[role\],在\[Background\]背景下,严格遵守 \[constrains\]以\[workflow\]的顺序和用户对话。

其它结构化Prompt:APE (Action Purpose Expect)、BROKE、ROSES.....等。

Prompt质量直接影响模型的输出效果,优秀的Prompt能够帮助AI模型更好地理解用户意图,从而回应更符合预期且有价值的回答。


四、提示模板-Prompt Templates

​​​​​使用传统的基于文本模板引擎进行提示创建和管理。Spring AI 为此使用 OSS 库StringTemplate。

例如,考虑简单的提示模板:Tell me a { adj } joke about { content }.


五、嵌入-Embeddings

嵌入是将非结构化数据(如文本、图像、视频)转换为高维浮点向量(浮点数数组)的表示方法。转换后得到的向量长度称为嵌入维度。

每个向量在抽象的语义空间中对应一个点。语义空间具有几何结构:点与点之间的空间距离反映了原始数据在语义上的相似程度 - 距离越近表示语义越接近。

在实践中,通过计算向量之间的数值距离(如欧氏距离或余弦距离),即可定量衡量不同对象的相似性。


六、嵌入模型-Embeddings Model

将数据“编码”成向量的模型。将文本数据(文档和问题)统一转换为计算机能理解的、具有语义信息的向量(Embedding)。常见嵌入模型如text-embedding-3-small(OpenAI)、text-embedding-v1-4、deepseek-embedding、KaLM-Embedding-Gemma3-12B-2511(腾讯)、BGE模型(北京智源人工智能研究院通用向量模型)等。


七、结构化输出-StructuredOutput

结构化输出转换器帮助将大型语言模型的输出转换为结构化格式。将AI模型的结果转化为指定的数据类型,如 JSON、XML 或 Java 类,并传递给其他应用方法。


八、检索增强生成-RAG

RAG是一种结合检索和生成的AI技术,又称Prompt Stuffing(提示填充),通过检索知识库中的相关信息来增强生成模型的输出效果,服务于问题检索效率的提升。

RAG = 检索技术 + LLM提示填充。

用户向LLM提问一个问题(query),RAG从各种数据源检索相关的信息,并将检索到的信息和问题注入到 LLM 提示词Prompt中,让LLM能够参考相应的知识从而给出合理回答。

检索技术主要是利用向量数据库的高效存储和检索能力,召回目标知识;LLM提示填充则是利用大模型和Prompt工程,将召回的知识合理利用,生成目标答案。

在知识库中应用RAG,需要对知识库进行切分(splitter)、分片(chunk)和嵌入增强(Embedding Embed)处理:

高级RAG-Advanced RAG

主要包含两个阶段:数据准备阶段与检索与生成阶段:

1.数据准备阶段(增强):

该阶段的目标是将企业内部知识转化为可供检索的向量数据,并存储于向量数据库中。

文档解析与分块(Chunking)

向量化(Embedding)

存储

2.数据检索与生成(RAG核心流程):该阶段实现用户提问后的智能检索与答案生成。

问题向量化

语义搜索

增强提示(Prompt 增强)

生成答案


七、其它概念

Token代币LLM的计量单位,1个Token≈0.75英文单词。

上下文窗口 (Context Window)

Prompt(输入)+ Resp(输出)的总Token上限,LLM能处理的最大Token数量。

上下文 (Context)

一次推理中实际输入的Token 内容 ,包含用户Prompt、历史对话、检索文档等。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 7:18:04

10.4 万 Star,MarkItDown 再次登顶

文章目录 前言 MarkItDown 是什么? 为什么又上 GitHub 周榜了? AI Agent 的万能接口 RAG 和 AI 文档处理需求爆发 MIT 许可证 + 微软背书 它到底解决了什么问题? LLM 读不懂文件 文档结构在转换中丢失 多模态数据的统一入口 怎么用? 命令行用法 Python API 用法 接入 Claud…

作者头像 李华
网站建设 2026/6/10 7:17:04

普通医用绷带/创可贴运输测试依据ASTM D4169-23E1标准

大家好,今天我们分享一个普通医用绷带/创可贴运输测试的案例。本次测试依据ASTM D4169-23E1标准,模拟了医用弹性绷带、无菌创可贴成品的全国干线陆运及快递配送场景。通过这个案例,我们可以直观地了解运输测试的流程和重要性。本次测试依据AS…

作者头像 李华
网站建设 2026/6/10 7:07:03

小程序毕业设计-nodejs基于微信小程序印象台院大学资讯新闻设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/10 7:05:25

AI Agent Harness故障演练:高可用验证

AI Agent Harness故障演练:高可用验证 引言 在当今数字化转型的浪潮中,人工智能(AI)系统已经从实验性项目转变为企业核心业务的关键支撑。特别是随着AI Agent技术的快速发展,越来越多的组织开始构建和部署自主决策、自…

作者头像 李华