news 2026/6/8 17:54:57

Rainbond v6.9.0 发布:新增 AI 大模型私有化部署,虚拟机能力全面升级

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Rainbond v6.9.0 发布:新增 AI 大模型私有化部署,虚拟机能力全面升级

AI 大模型:在自己的平台上部署和运行模型

v6.9.0 新增 AI 大模型能力,面向企业和团队的大模型私有化部署场景,支持把模型部署在自己的集群和资源中,并通过 OpenAI 兼容接口接入业务系统。启用 AI 大模型插件后,“工作空间”左侧导航会出现“AI 大模型”入口,下面包含模型仓库、模型实例、API 密钥和模型监控四个模块。

模型准备与部署

在“模型仓库”中选择需要部署的模型,目前支持“内置模型”(平台预置一批常用模型)、“ModelScope”(从模型社区拉取)、“HTTP 地址 / 本地路径 / 文件上传”(使用自有模型文件)几种来源。模型状态变为“已下载”后,进入部署配置。文本大模型默认使用 vLLM 引擎;GPU 部署需选择 GPU 型号、数量和目标节点,也支持 CPU 部署(适合做轻量验证)。vLLM 的量化方式、显存利用率、最大上下文长度、额外启动参数等都可以在页面上配置,建议首次部署先使用默认配置完成验证。当前 GPU 资源识别和分配以 NVIDIA GPU 为主,启用前请确认集群环境。

模型实例管理

部署完成后,进入“模型实例”模块管理已部署的模型实例,可查看实例状态、节点分布、运行详情和日志;对实例执行启动、停止、删除操作;对运行中的实例发起在线对话,验证模型响应;实例异常时,结合运行详情和日志判断是模型加载、启动参数、资源不足还是服务响应方面的问题。

API 密钥与 OpenAI 兼容调用

在“API 密钥”模块创建密钥,页面提供 OpenAI 兼容的接入示例,包括 base URL、curl 示例和 Python OpenAI SDK 示例。业务系统在原有 OpenAI 调用链路基础上替换 base URL 和 API key 即可接入。请求中按模型名称调用,平台会查找对应的运行中实例。

模型监控

“模型监控”模块包含“服务层面”(在线服务数、健康服务数、运行实例数、请求数、失败数、平均响应时间)和“GPU 层面”(GPU 总览、节点汇总、设备列表、单卡趋势、实例与设备的占用关系)两个层面。

虚拟机能力增强

本次版本对虚拟机能力进行了一轮增强,主要更新包括:“qcow2 镜像直接部署”,支持将其他虚拟化工具(如 VMware、KVM 等)导出的 qcow2 镜像直接部署到 Rainbond,便于已有虚拟机资产迁移;“规格热更新”,运行中的虚拟机支持热扩容 CPU 或内存,注意 CPU 和内存不能在同一次操作中同时热更新、仅支持扩容不支持缩容,GPU 直通和 USB 透传虚拟机暂不支持热更新,不满足条件时平台会自动转为重启生效;“多虚拟机应用级编排”,支持把多个虚拟机和其他组件按应用方式统一编排,在拓扑图中查看依赖关系,并保留连接信息、端口、存储等应用级配置;“整套应用模板交付”,编排好的虚拟机应用可以发布成 Rainbond 应用模板,连同虚拟机系统数据一起打包,导出 `rainbond - app` 安装包后可在新环境导入恢复,发布前需先创建快照并关闭虚拟机,携带虚拟机类型的模板快照不支持回滚升级;“Windows 驱动盘挂载”,在组件存储视图中支持挂载 VirtIO 驱动盘,用于解决 Windows 安装阶段识别不到磁盘或网卡的问题;“监控与配置统一”,组件视图中支持查看虚拟机的 CPU、内存、网络流量、磁盘读写流量与 IOPS、文件系统使用量等指标,CPU、内存、磁盘、网络、GPU 直通、USB 透传等运行配置统一在组件视图中管理。当前虚拟机仅支持 amd64 架构,arm64 暂不支持。

其他变更

新增功能

新增 AI 大模型私有化部署能力,支持模型部署、实例管理、OpenAI 兼容调用和模型与 GPU 监控;虚拟机支持 qcow2 镜像直接部署、规格热更新(CPU、内存运行态扩容)、多虚拟机应用级编排、整套应用模板交付(连同系统数据一起打包)、Windows VirtIO 驱动盘挂载,虚拟机组件视图支持监控指标查看与运行配置统一管理。

Bug 修复

修复 RainAgent 偶发断联、消息发送失败的问题(新增兜底机制和静默重试);修复 RainAgent 接口密钥不修改时无法保存其他配置的问题;修复 opencode 使用 RainSkills 时 MCP 第二天过期的问题;优化 AI 助手更新提示信息;优化删除组件、端口、存储等操作的错误提示和引导;优化 RainAgent 错误信息的展示与稳定性;优化 RainAgent 操作组件时的识别准确率;修复 ROI 一些问题;修复快照/模板导入导出伸缩规则不生效;修复 UI 滚动条问题;修复对接 Harbor 无法展示更多的项目;修复 dockercompose 在 ARM 环境下无法构建;修复 Helm 默认安装无法选择节点。

平台升级

在线环境:`平台管理 -> 企业设置 -> 升级`,执行一键升级。离线环境:请阅读离线升级文档。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 17:49:48

从0到1开发Pushup博客系统:完整CRUD功能实现指南

从0到1开发Pushup博客系统:完整CRUD功能实现指南 【免费下载链接】pushup Pushup is for making modern, page-oriented web apps in Go 项目地址: https://gitcode.com/gh_mirrors/pu/pushup 想要快速构建现代化的Go语言Web应用吗?Pushup框架让你…

作者头像 李华
网站建设 2026/6/8 17:47:19

i.MX 7ULP功耗优化实战:从测量到系统级低功耗设计

1. 项目概述与核心价值在嵌入式系统开发,尤其是电池供电的物联网终端、可穿戴设备或便携式仪器中,功耗是决定产品成败的关键指标之一。我们常常面临一个核心矛盾:如何在满足应用性能需求的同时,尽可能地延长设备的续航时间。这不仅…

作者头像 李华
网站建设 2026/6/8 17:47:18

可以使用 BAT 文件干哪些事情

很多人对 .bat 文件的印象还停留在"双击运行一个黑窗口"的阶段。实际上,BAT(Batch)文件是 Windows 系统自带的脚本语言,虽然语法简陋,但能干的事远比你想的多。 这篇文章不讲语法教程,只讲它到底…

作者头像 李华
网站建设 2026/6/8 17:45:21

如何用HsMod解锁60+炉石传说隐藏功能:终极免费优化指南

如何用HsMod解锁60炉石传说隐藏功能:终极免费优化指南 【免费下载链接】HsMod Hearthstone Modification Based on BepInEx 项目地址: https://gitcode.com/GitHub_Trending/hs/HsMod HsMod是一款基于BepInEx开发的炉石传说插件框架,为玩家提供超…

作者头像 李华
网站建设 2026/6/8 17:45:20

PN7160 DLMA配置实战:动态负载调制提升NFC卡模拟兼容性与距离

1. 项目概述:为什么我们需要动态负载调制幅度(DLMA)?在NFC卡模拟的实际项目中,你是否遇到过这样的困扰:同一张模拟卡,在A品牌的POS机上能稳定交易,换到B品牌的闸机上却怎么也读不出来…

作者头像 李华