MyBatisPlus代码生成后，使用VoxCPM-1.5-TTS-WEB-UI播报开发进度-平芜编程栈

MyBatisPlus代码生成后，使用VoxCPM-1.5-TTS-WEB-UI播报开发进度

在现代软件开发中，我们每天都在和“等待”打交道：等构建完成、等部署上线、等接口响应。而最让人焦虑的，不是任务本身耗时多久，而是——你不知道它到底完没完。

尤其当你运行一个脚本批量生成几十张表的 CRUD 代码时，看着控制台滚动的日志，心里总会嘀咕：“到底跑完了没有？” 切过去看一眼？可能才跑了三分之一。这种频繁的上下文切换，悄无声息地吞噬着专注力。

有没有一种方式，能让系统主动告诉你：“好了，你可以继续了”？

答案是：让代码“说话”。

最近我在项目中尝试了一个小实验：当 MyBatisPlus 完成代码自动生成后，自动通过本地语音模型播报提示音。整个过程无需联网、不依赖云服务，用的是一个叫VoxCPM-1.5-TTS-WEB-UI的本地化文本转语音工具。结果出乎意料地实用——那种“耳边响起一声‘代码已生成’”的感觉，像是有个助理在旁边轻声提醒，既自然又高效。

这背后其实并不复杂，但融合了自动化、AI 推理与工程实践的巧妙结合。下面我来拆解这个“会说话的代码生成器”是如何实现的。

从数据库到 Java 类：MyBatisPlus 的自动化魔法

如果你还在手写 Entity、Mapper、Service 这些模板类，那真的可以停下来试试 MyBatisPlus 的AutoGenerator。

它做的事情很简单：连接数据库 → 读取表结构 → 套模板 → 输出 Java 文件。但它做得足够聪明，支持 Lombok、Swagger 注解、REST 风格命名、表前缀剔除……几乎你能想到的定制点，它都提供了配置项。

比如这段典型的生成器代码：

public class CodeGenerator { public static void main(String[] args) { AutoGenerator mpg = new AutoGenerator(); // 全局配置 GlobalConfig gc = new GlobalConfig(); gc.setOutputDir(System.getProperty("user.dir") + "/src/main/java"); gc.setAuthor("dev-team"); gc.setOpen(false); gc.setEntityName("%sEntity"); gc.setServiceImplName("%sServiceImpl"); mpg.setGlobalConfig(gc); // 数据源 DataSourceConfig dsc = new DataSourceConfig(); dsc.setUrl("jdbc:mysql://localhost:3306/dev_db?useUnicode=true&characterEncoding=utf8"); dsc.setDriverName("com.mysql.cj.jdbc.Driver"); dsc.setUsername("root"); dsc.setPassword("password"); mpg.setDataSource(dsc); // 包路径 PackageConfig pc = new PackageConfig(); pc.setModuleName("demo"); pc.setParent("com.example"); mpg.setPackageInfo(pc); // 策略配置 StrategyConfig strategy = new StrategyConfig(); strategy.setNaming(NamingStrategy.underline_to_camel); strategy.setColumnNaming(NamingStrategy.underline_to_camel); strategy.setEntityLombokModel(true); strategy.setRestControllerStyle(true); strategy.setInclude("user_info", "order_detail"); mpg.setStrategy(strategy); // 执行 mpg.execute(); } }

这套流程本来已经够自动化了，但如果能在这个execute()调用之后加一句“我已经干完了”，是不是更有仪式感？

关键就在于最后一步的“通知机制”。

让机器开口说话：VoxCPM-1.5-TTS-WEB-UI 的能力边界

市面上 TTS 工具不少，但我选择VoxCPM-1.5-TTS-WEB-UI并非偶然。它的核心优势在于三个字：本地化。

很多开发者习惯用阿里云、Azure 或讯飞的语音合成 API，虽然音质不错，但每次请求都要走网络，还涉及密钥管理、计费、隐私等问题。而在本地跑一个语音模型，意味着：

不用担心数据外泄；
没有调用频率限制；
响应更快，延迟更可控；
可以离线使用。

VoxCPM-1.5 正好满足这些需求。它基于大规模语言模型架构，支持高保真语音合成（44.1kHz 采样率），甚至能做简单的音色克隆。更重要的是，它提供了一个开箱即用的 Web UI 镜像，启动后直接访问http://localhost:6006就能输入文字听声音。

其工作流程如下：

graph TD A[用户输入文本] --> B(前端页面) B --> C{发送 POST /tts} C --> D[后端接收 JSON] D --> E[模型推理生成音频] E --> F[返回 WAV 流] F --> G[浏览器播放]

这意味着，只要你的程序能发 HTTP 请求，就能让它“说话”。

如何让 Java “喊出” 一声提示？

Java 本身没有内置的 TTS 客户端，但我们可以通过外部脚本桥接。我的做法是：在 MyBatisPlus 生成代码完成后，调用一个 Python 脚本，由它向 VoxCPM 发起语音请求。

Python 脚本如下：

import requests import json import sys def tts_speak(text, speaker="default"): url = "http://localhost:6006/tts" payload = { "text": text, "speaker": speaker, "speed": 1.0 } headers = {'Content-Type': 'application/json'} try: response = requests.post(url, data=json.dumps(payload), headers=headers, timeout=30) if response.status_code == 200: with open("output.wav", "wb") as f: f.write(response.content) # 自动播放（可选） import wave import pyaudio wf = wave.open("output.wav", 'rb') p = pyaudio.PyAudio() stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(), rate=wf.getframerate(), output=True) data = wf.readframes(1024) while data: stream.write(data) data = wf.readframes(1024) stream.stop_stream() stream.close() p.terminate() print("✅ 语音播报完成") else: print(f"❌ 请求失败：{response.status_code}") except Exception as e: print(f"⚠️ 网络错误：{e}") if __name__ == "__main__": if len(sys.argv) > 1: message = " ".join(sys.argv[1:]) else: message = "代码生成已完成，请及时查看。" tts_speak(message)

这个脚本不仅能发送请求，还能自动播放生成的.wav文件，真正实现“无声执行，有声反馈”。

然后在 Java 中通过ProcessBuilder调用它：

// 在 mpg.execute(); 后添加 try { ProcessBuilder pb = new ProcessBuilder( "python", "scripts/tts_notify.py", "用户模块代码生成完毕，共创建 6 个文件。" ); pb.inheritIO(); // 输出共享到控制台 Process process = pb.start(); process.waitFor(); } catch (Exception e) { System.err.println("语音通知失败：" + e.getMessage()); }

这样一来，整个链路就连通了：

Java 生成代码 → 触发 Python 脚本 → HTTP 请求 TTS 服务 → 返回并播放语音

实际体验中的设计细节

别看只是一个“播报”，真要让它稳定可用，还得考虑不少细节。

1. 服务要不要常驻？

VoxCPM 启动一次需要加载几 GB 的模型，如果每次生成代码都重启一次，光加载就得十几秒，得不偿失。因此我建议：

将 TTS 服务作为常驻进程运行

可以用 Docker Compose 统一管理：

version: '3' services: tts: image: aistudent/voxcpm-tts-webui:latest ports: - "6006:6006" volumes: - ./models:/app/models restart: unless-stopped

或者用 systemd 写个守护进程，开机自启，永远在线。

2. 报什么内容才有效？

语音信息必须简洁明确。太长没人愿意听，太模糊等于白说。

推荐格式：
- ✅ “✅ [功能名] 生成成功”
- ✅ “⚠️ [任务] 失败，请检查日志”
- ❌ “Hello, this is your system speaking…”

还可以根据不同事件换音色或语速，比如：
- 成功用男声+正常语速；
- 错误用女声+稍快语速，带点紧迫感。

3. 出错了怎么办？不能卡住主流程

语音只是辅助，绝不能因为 TTS 服务宕机就导致代码没生成。

所以通知逻辑一定要：
- 异步执行（或设置超时）；
- 捕获异常，降级为日志输出；
- 不阻塞主流程。

例如在 Java 中加上pb.redirectErrorStream(true)和waitFor(5, TimeUnit.SECONDS)，避免无限等待。

4. 资源占用多少？

实测数据：
- 内存占用：约 3.8GB（CPU 模式）；
- GPU 显存：约 2.1GB（RTX 3060, FP16）；
- 单次推理延迟：~1.2 秒（百字以内）；

对于现代开发机来说完全可接受。但如果是在 CI/CD 环境中使用，建议只在本地调试开启语音，在服务器上关闭。

更进一步：不只是“代码生成”

这个模式一旦打通，你会发现它的扩展性极强。几乎所有“长时间运行的任务”，都可以接入语音反馈：

场景	报播内容
数据库迁移完成	“数据库 schema 更新成功”
单元测试通过	“全部测试通过，共 127 个用例”
Maven 打包结束	“JAR 包已生成，位于 target 目录”
Docker 镜像构建完成	“镜像 dev-app:v1.2 已构建完成”

甚至可以反过来：用语音触发命令。比如对着麦克风说“生成用户模块代码”，然后语音识别 → 执行脚本 → 再语音回复结果。这才叫真正的“智能开发助手”。