Solon AI 4.0的ChatModel：简洁API封装样板代码，多方式构建AI功能！-平芜编程栈

Java应用集成大语言模型的新方案

如果你尝试过在Java应用中集成大语言模型（LLM），大概率写过不少样板代码，像HTTP客户端、JSON解析、流式处理、会话管理等。而Solon AI 4.0的 `ChatModel` 用一套简洁的Builder API把这些都封装好了。本文将通过真实的代码示例，带你一步步用 `ChatModel` 构建AI功能，从简单的单次调用，到带记忆的流式聊天机器人。

什么是ChatModel？

`ChatModel` 是Solon AI生态中的统一LLM客户端。你不再需要为不同的模型提供商写不同的HTTP调用，而是通过一套统一的API完成多种操作，包括同步调用（一次请求，完整返回）、流式调用（基于Project Reactor的响应式流 `Flux`）、工具/函数调用（让LLM调用你的Java方法）、聊天会话（自动维护对话记忆）、多模态消息（文本、图片、音频）、方言适配（支持OpenAI、Ollama、Anthropic、Gemini、DashScope等多种服务商）。最核心的是它使用了 **方言模式（Dialect Pattern）**，你只需要指向任意兼容的LLM端点，它会自动适配协议。

环境配置

在 `pom.xml` 中添加依赖（Solon不需要父POM，独立工作）：

<dependency> <groupId>org.noear</groupId> <artifactId>solon-ai</artifactId> <version>${solon.version}</version> </dependency>

这会引入所有内置的方言适配器（OpenAI、Ollama、Gemini、Anthropic、DashScope）。

配置方式

通过YAML配置（推荐）

solon.ai.chat: demo: apiUrl: "http://127.0.0.1:11434/api/chat" _# 完整URL，非baseUrl_ standard: "ollama" _# 接口规范（方言标识）_ model: "llama3.2" _# 模型名称_ headers: x-demo: "demo1"

然后通过 `@Bean` 注入一个可以直接使用的 `ChatModel`：

import org.noear.solon.ai.chat.ChatConfig; import org.noear.solon.ai.chat.ChatModel; import org.noear.solon.annotation.Bean; import org.noear.solon.annotation.Configuration; import org.noear.solon.annotation.Inject; @Configuration public class AiConfig { @Bean public ChatModel chatModel(@Inject("${solon.ai.chat.demo}") ChatModel model) { return model; } }

编程式Builder

@Bean public ChatModel chatModel() { return ChatModel.of("http://127.0.0.1:11434/api/chat") .standard("ollama") _// 或 .provider( "ollama")_ .model("llama3.2") .timeout(Duration.ofSeconds(60)) .build(); }

支持的模型提供商

`standard`（或 `provider`）字段选择方言：

方言标识	apiUrl 示例	模型
`openai`（默认）	`https://api.openai.com/v1/chat/completions`	GPT、DeepSeek、Qwen、GLM、Kimi等
`ollama`	`http://127.0.0.1:11434/api/chat`	本地Ollama模型
`anthropic`	`https://api.anthropic.com/v1/messages`	Claude
`gemini`	`https://generativelanguage.googleapis.com/...`	Gemini
`dashscope`	阿里云DashScope端点	Qwen（DashScope原生）

同步调用（最简单的方式）

最基本的用法是发送提示词，获取完整响应：

import org.noear.solon.ai.chat.ChatModel; import org.noear.solon.ai.chat.ChatResponse; import org.noear.solon.annotation.Inject; import org.noear.solon.annotation.Component; @Component public class ChatService { @Inject ChatModel chatModel; public String ask(String question) throws IOException { ChatResponse resp = chatModel.prompt(question).call(); return resp.getMessage().getContent(); } }

仅三行业务代码，搞定。

流式调用（实时响应）

对于聊天机器人和助手类应用，流式响应是刚需。`ChatModel` 返回Reactor的 `Flux`：

import reactor.core.publisher.Flux; public Flux<String> askStream(String question) throws IOException { return chatModel.prompt(question) .stream() .filter(resp -> resp.hasContent()) _// 跳过空块_ .map(resp -> resp.getContent()); }

如果你使用Solon Web Reactive，可以直接把 `Flux` 返回给SSE端点：

import org.noear.solon.web.sse.SseEvent; import org.noear.solon.annotation.Mapping; import reactor.core.publisher.Flux; @Mapping("/chat/stream") public Flux<SseEvent> chatStream(String prompt) throws IOException { return chatModel.prompt(prompt) .stream() .filter(resp -> resp.hasContent()) .map(resp -> new SseEvent().data(resp.getContent())); }

流式协议根据提供商不同，使用标准SSE或 `x-ndjson`。

对话记忆：ChatSession

基本用法

import org.noear.solon.ai.chat.ChatSession; import org.noear.solon.ai.chat.session.InMemoryChatSession; ChatSession session = InMemoryChatSession.builder() .sessionId("user-123") .maxMessages(10) _// 保留最近10轮_ .build(); _// 第一轮_ ChatResponse resp1 = chatModel.prompt("你好！") .session(session) .call(); _// 第二轮 ----模型记得刚才的对话_ ChatResponse resp2 = chatModel.prompt("我刚才说了什么？") .session(session) .call();

Web应用中的用户级会话

import org.noear.solon.annotation.Controller; import org.noear.solon.web.sse.SseEvent; import reactor.core.publisher.Flux; import java.util.Map; import java.util.concurrent.ConcurrentHashMap; @Controller public class ChatController { @Inject ChatModel chatModel; final Map<String, ChatSession> sessionMap = new ConcurrentHashMap<>(); @Mapping("/chat") public Flux<SseEvent> chat(String sessionId, String prompt) throws IOException { ChatSession session = sessionMap.computeIfAbsent(sessionId, k -> InMemoryChatSession.builder().sessionId(k).build()); return chatModel.prompt(prompt) .session(session) .options(o -> o.systemPrompt("你是一个友好、乐于助人的助手。")) .stream() .filter(ChatResponse::hasContent) .map(resp -> new SseEvent().data(resp.getContent())); } }

内置会话实现

实现类	存储方式	适用场景
`InMemoryChatSession`	本地Map	开发、单节点
`FileChatSession`	文件系统	CLI工具、桌面应用
`RedisChatSession`	Redis	生产环境、分布式部署

调优：ChatOptions

通过 `ChatOptions` 可以在每次请求中控制模型行为：

chatModel.prompt("写一首关于Java的诗") .options(o -> o .temperature(0.8) .max_tokens(500) .top_p(0.9) .systemPrompt("你是一位富有创造力的诗人。")) .call();

部分常用参数：

方法	说明
`temperature(val)`	采样温度（0.0 - 2.0）
`max_tokens(val)`	最大输出Token数
`top_p(val)`	核采样参数
`top_k(val)`	Top - K采样
`frequency_penalty(val)`	降低重复
`presence_penalty(val)`	鼓励新话题
`tool_choice(val)`	强制工具调用：`none`、`auto`、`required` 或工具名
`role(val)`	Agent角色（role + instruction可自动生成systemPrompt）
`instruction(val)`	Agent指令（role + instruction可自动生成systemPrompt）
`systemPrompt(val)`	本次请求的系统提示词（完全定制）

多消息Prompt

有时候你需要的不只是一条消息。可以用 `Prompt` 和 `ChatMessage` 构建更复杂的上下文：

import org.noear.solon.ai.chat.Prompt; import org.noear.solon.ai.chat.message.ChatMessage; Prompt prompt = Prompt.of( ChatMessage.ofUser("Hello, how are you?"), ChatMessage.ofAssistant("Bonjour, comment allez-vous?"), ChatMessage.ofUser("What is your name?") ); ChatResponse resp = chatModel.prompt(prompt).options(o -> o.systemPrompt("你是一名中英翻译专家。")).call();

完整实战：知识感知聊天机器人

下面是一个轻量级的RAG模式示例，用 `ChatMessage.ofUserAugment()` 把上下文注入到Prompt中：

import org.noear.solon.ai.chat.ChatModel; import org.noear.solon.ai.chat.ChatResponse; import org.noear.solon.ai.chat.message.ChatMessage; import org.noear.solon.annotation.Component; import org.noear.solon.annotation.Inject; @Component public class KnowledgeChatbot { @Inject ChatModel chatModel; public String answer(String question, String referenceContext) throws Exception { _// 将参考上下文与用户问题合并_ ChatMessage augmented = ChatMessage.ofUserAugment(question, referenceContext); ChatResponse resp = chatModel.prompt(augmented) .options(o -> o .temperature(0.3) .systemPrompt("你是一个知识渊博的助手。请基于提供的参考资料回答。")) .call(); return resp.getMessage().getContent(); } }

这种模式，用上下文增强用户输入，再调用模型，正是Solon AI中RAG（检索增强生成）的基础。