AI 大模型:在自己的平台上部署和运行模型
v6.9.0 新增 AI 大模型能力,面向企业和团队的大模型私有化部署场景,支持把模型部署在自己的集群和资源中,并通过 OpenAI 兼容接口接入业务系统。启用 AI 大模型插件后,“工作空间”左侧导航会出现“AI 大模型”入口,下面包含模型仓库、模型实例、API 密钥和模型监控四个模块。
模型准备与部署
在“模型仓库”中选择需要部署的模型,目前支持“内置模型”(平台预置一批常用模型)、“ModelScope”(从模型社区拉取)、“HTTP 地址 / 本地路径 / 文件上传”(使用自有模型文件)几种来源。模型状态变为“已下载”后,进入部署配置。文本大模型默认使用 vLLM 引擎;GPU 部署需选择 GPU 型号、数量和目标节点,也支持 CPU 部署(适合做轻量验证)。vLLM 的量化方式、显存利用率、最大上下文长度、额外启动参数等都可以在页面上配置,建议首次部署先使用默认配置完成验证。当前 GPU 资源识别和分配以 NVIDIA GPU 为主,启用前请确认集群环境。
模型实例管理
部署完成后,进入“模型实例”模块管理已部署的模型实例,可查看实例状态、节点分布、运行详情和日志;对实例执行启动、停止、删除操作;对运行中的实例发起在线对话,验证模型响应;实例异常时,结合运行详情和日志判断是模型加载、启动参数、资源不足还是服务响应方面的问题。
API 密钥与 OpenAI 兼容调用
在“API 密钥”模块创建密钥,页面提供 OpenAI 兼容的接入示例,包括 base URL、curl 示例和 Python OpenAI SDK 示例。业务系统在原有 OpenAI 调用链路基础上替换 base URL 和 API key 即可接入。请求中按模型名称调用,平台会查找对应的运行中实例。
模型监控
“模型监控”模块包含“服务层面”(在线服务数、健康服务数、运行实例数、请求数、失败数、平均响应时间)和“GPU 层面”(GPU 总览、节点汇总、设备列表、单卡趋势、实例与设备的占用关系)两个层面。
虚拟机能力增强
本次版本对虚拟机能力进行了一轮增强,主要更新包括:“qcow2 镜像直接部署”,支持将其他虚拟化工具(如 VMware、KVM 等)导出的 qcow2 镜像直接部署到 Rainbond,便于已有虚拟机资产迁移;“规格热更新”,运行中的虚拟机支持热扩容 CPU 或内存,注意 CPU 和内存不能在同一次操作中同时热更新、仅支持扩容不支持缩容,GPU 直通和 USB 透传虚拟机暂不支持热更新,不满足条件时平台会自动转为重启生效;“多虚拟机应用级编排”,支持把多个虚拟机和其他组件按应用方式统一编排,在拓扑图中查看依赖关系,并保留连接信息、端口、存储等应用级配置;“整套应用模板交付”,编排好的虚拟机应用可以发布成 Rainbond 应用模板,连同虚拟机系统数据一起打包,导出 `rainbond - app` 安装包后可在新环境导入恢复,发布前需先创建快照并关闭虚拟机,携带虚拟机类型的模板快照不支持回滚升级;“Windows 驱动盘挂载”,在组件存储视图中支持挂载 VirtIO 驱动盘,用于解决 Windows 安装阶段识别不到磁盘或网卡的问题;“监控与配置统一”,组件视图中支持查看虚拟机的 CPU、内存、网络流量、磁盘读写流量与 IOPS、文件系统使用量等指标,CPU、内存、磁盘、网络、GPU 直通、USB 透传等运行配置统一在组件视图中管理。当前虚拟机仅支持 amd64 架构,arm64 暂不支持。
其他变更
新增功能
新增 AI 大模型私有化部署能力,支持模型部署、实例管理、OpenAI 兼容调用和模型与 GPU 监控;虚拟机支持 qcow2 镜像直接部署、规格热更新(CPU、内存运行态扩容)、多虚拟机应用级编排、整套应用模板交付(连同系统数据一起打包)、Windows VirtIO 驱动盘挂载,虚拟机组件视图支持监控指标查看与运行配置统一管理。
Bug 修复
修复 RainAgent 偶发断联、消息发送失败的问题(新增兜底机制和静默重试);修复 RainAgent 接口密钥不修改时无法保存其他配置的问题;修复 opencode 使用 RainSkills 时 MCP 第二天过期的问题;优化 AI 助手更新提示信息;优化删除组件、端口、存储等操作的错误提示和引导;优化 RainAgent 错误信息的展示与稳定性;优化 RainAgent 操作组件时的识别准确率;修复 ROI 一些问题;修复快照/模板导入导出伸缩规则不生效;修复 UI 滚动条问题;修复对接 Harbor 无法展示更多的项目;修复 dockercompose 在 ARM 环境下无法构建;修复 Helm 默认安装无法选择节点。
平台升级
在线环境:`平台管理 -> 企业设置 -> 升级`,执行一键升级。离线环境:请阅读离线升级文档。