news 2026/1/9 17:07:30

联蔚盘云-使用火山方舟的Deepseek+Doubao+CherryStudio构建本地运维知识库

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
联蔚盘云-使用火山方舟的Deepseek+Doubao+CherryStudio构建本地运维知识库

挑战:AI安全隐私问题 vs 本地化部署成本

在运维项目上,我们往往遇到需要查阅大量的技术文档和配置信息的情况,通过AI知识库管理和输出这些信息能大大提高我们的工作效率。

但是,由于很多信息会涉及客户的内部技术和保密信息,通过公用的AI服务去处理显然不符合安全要求;但是通过本地模型处理,又会引发性能和硬件成本的挑战。

针对这些挑战,联蔚盘云的合作伙伴——火山引擎推出了火山方舟互信计算架构(参考文件:《火山方舟互信计算架构白皮书》),它通过结合云原生安全沙箱、加密存储、网络隔离以及联邦精调等技术,针对大模型数据预处理、推理、精调以及评测等场景提供了全链路数据安全增强。

图1: 火山方舟大模型安全沙箱架构

本文将基于火山方舟提供的DeepSeek-R1、Doubao-embedding(向量模型),配合本地客户端软件CherryStudio,来介绍如何部署本地的私有化知识库。

安装CherryStudio

关于CherryStudio

CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。CherryStudio的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。

无论是零基础用户还是开发者,都能在 CherryStudio 中找到适合自己的AI功能,提升工作效率和创造力。

CherryStudio的本地知识库系统

  • 多种格式支持:支持 PDF、DOCX、PPTX、XLSX、TXT、MD 等多种文件格式导入。

  • 多种数据源支持:支持本地文件、网址、站点地图甚至手动输入内容作为知识库源。

  • 知识库导出:支持将处理好的知识库导出并分享给他人使用。

  • 支持搜索检查:知识库导入后,用户可实时检索测试,查看处理结果和分段效果。

更多相关的介绍和功能,可以参考CherryStudio的官放文档(https://docs.cherry-ai.com/)或者Github(https://github.com/CherryHQ/cherry-studio

下载CherryStudio

目前最新的版本v1.1.7,可以从官网或github下载(https://cherry-ai.com/download)。在下载页面中,你会看到针对不同操作系统的下载选项,如 macOS Intel 芯片版(x64)、macOS Apple芯片版(ARM64)、Linux x86_64 版本以及 Linux ARM64 版本等等 。根据自己的操作系统选择对应的版本进行下载。也可以在 GitHub 仓库(https://github.com/CherryHQ/cherry-studio/releases)中找到最新版本的安装包进行下载。

开启火山方舟服务

如文章开始时提到,火山方舟是火山引擎提供的一站式大模型开发平台,我们能在里面使用豆包大模型、Deepseek-R1等热门模型。

开通模型

第一步,注册登陆火山方舟控制台(https://console.volcengine.com/ark/

第二步,在【开通管理】页面,找到Deepseek-R1和Doubao-embedding两种模型,点击“开通服务”

第三步,在【API Key管理】页面,创建一个新的“API Key”,用于后面Cherry Studio调用火山方舟的大模型服务。

第四步,在【在线推理】页面,点击“创建推理接入点”,为两个模型各创建一个接入点。这里创建出来的 “接入点ID” 将作为”模型ID“被Cherry Studio配置使用,所以一点不要搞混。

配置CherryStudio调用LLM

回到Cherry Studio,进入设置界面。

第一步,把“火山引擎”启用,填入之前申请的API密钥,API地址初填入https://ark.cn-beijing.volces.com/api/v3

第二步,添加模型,分别填入上面创建的两个接入点信息。

第三步,配置完成并点击检查,检查API访问是否正常。

导入数据构建知识库

第一步:在 Cherry Studio 主界面左侧,点击 “知识库” 图标,进入知识库管理页面。点击 “添加本地文档” 按钮,在弹出的窗口中,填写知识库名称,然后选择之前添加的嵌入模型,点击 “确定” 创建知识库。

第二步:导入数据,Cherry Studio 支持多种数据导入方式:

本地文件:点击知识库右侧的 “添加文件” 按钮,在弹出的文件选择窗口中,选择你要导入的文件,点击 “打开”,系统会自动进行向量化处理,当文件旁边显示绿色对勾时,表示处理完成。

文件夹目录:点击 “添加文件夹” 按钮,选择包含相关文件的文件夹目录,该目录下支持格式的文件会被自动向量化处理。

网址链接:点击 “添加网址” 按钮,输入网址链接,系统会自动抓取网页内容并进行处理。

站点地图:点击 “添加站点地图” 按钮,选择 xml 格式的站点地图文件,系统会根据站点地图中的链接,抓取相关网页内容并进行处理。

纯文本笔记:点击 “添加笔记” 按钮,在弹出的文本输入框中,输入纯文本内容,然后点击 “保存”,即可将文本内容添加到知识库中。

第三步:回到Cherry Studio的对话窗口,创建一个“运维工程师助手”,右键选择“编辑助手”,先配置“模型设置”,选择 DeepSeek-R1,然后点击“知识库设置”,选择刚才创建的知识库:

配置完成后,我们就可以问日常工作遇到的问题了,在参考知识库后,会立马给出对知识库相关知识的梳理后的技巧:

优化技巧

1.调参优化:通过调整「温度值」(0-1区间)控制回答创意性,设置「最大生成长度」匹配问题复杂度

2.数据动态更新:定期补充最新行业资料(如季度更新技术文档),及时清理过期信息

3.预处理三要素:导入前执行文本去重、清洗特殊字符,复杂PDF转纯文本格式


联蔚盘云——国内领先的多云管理服务提供商

联蔚盘云秉持“帮助客户创造更多价值” 理念,基于深厚的行业经验和客户洞察,以技术创新为本,持续耕耘于云管理服务,为众多中大型行业客户提供基于自主研发基础上的FinOps 云成本优化(订阅制)、AI 大模型,平台工程全生命周期管理、信息安全- 等保、云安全、AI 安全、合规咨询、MSP- 云迁移、云运维、云灾备一站式服务、数据等多云管理全生命周期领先产品及解决方案,帮助客户降本提效、通过云能力提升驱动业务,迎接瞬息万变的挑战,赋能企业数字化转型,拥有云、SRE、安全、项目管理等各领域的专业认证,连续多年获得Gartner 等市场权威机构认可,是微软、阿里云和AWS 等公有云头部合作伙伴。

20 多年成功服务了100+ 世界及中国500 强客户,基于深厚的行业经验和客户洞察,在零售、消费品、汽车、制造、房地产、金融等行业帮助客户应对数字化时代瞬息万变的商业挑战,创造共创共赢的合作模式,让多云管理更简单。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/29 15:13:03

用Python模擬百萬神經元的脈衝神經網路:事件驅動計算的極限挑戰

用Python模擬百萬神經元的脈衝神經網路:事件驅動計算的極限挑戰摘要脈衝神經網路(Spiking Neural Networks, SNNs)作為第三代神經網路,其生物合理性和事件驅動特性引發了計算神經科學和人工智慧領域的革命。本文全面探討使用Pytho…

作者头像 李华
网站建设 2025/12/29 15:12:58

在1MB記憶體下用Python實時處理10GB/秒數據流的極限挑戰

在1MB記憶體下用Python實時處理10GB/秒數據流的極限挑戰摘要本文探討如何在僅有1MB記憶體的極端限制下,使用Python處理高達10GB/秒的數據流。我們將深入分析記憶體管理、流式處理算法、外部存儲技術,並提供具體的實現方案和優化策略。目錄問題定義與挑戰…

作者头像 李华
网站建设 2026/1/8 10:52:17

BioSIM人TRAILFc融合蛋白SIM0497:拓展靶向凋亡产品矩阵

在生命科学与医药研发的前沿领域,TRAIL(肿瘤坏死因子相关凋亡诱导配体)作为一种重要的细胞凋亡调节因子,因其在癌症治疗中的潜在价值而备受关注。近年来,随着生物技术的不断进步,针对TRAIL的靶向药物研发成…

作者头像 李华
网站建设 2026/1/4 7:38:32

2025年金融AI CRM系统榜单揭晓:原圈科技为何胜出?

在2025年的金融行业,选择合适的AI CRM系统是提升高净值客户服务能力的关键。在众多方案中,原圈科技被普遍视为头部代表之一,其AI CRM系统在技术能力、行业适配度与服务稳定性等多个维度下表现突出。原圈科技凭借其独特的“私域AI底座”架构&a…

作者头像 李华
网站建设 2026/1/8 1:36:49

清华镜像源加速下载PyTorch-CUDA-v2.7 Docker镜像教程

清华镜像源加速下载PyTorch-CUDA-v2.7 Docker镜像教程 在深度学习项目开发中,最让人头疼的往往不是模型设计本身,而是环境搭建——尤其是当你要在一个新服务器上配置 PyTorch CUDA 环境时。明明代码写好了,却卡在 torch.cuda.is_available(…

作者头像 李华
网站建设 2025/12/29 15:08:20

Python环境安装selenium模块的问题及解决方法

本章节我们主要讲解“Python环境安装selenium模块的问题及解决方法”的内容,首先要知道做web自动化测试首先是测试环境搭建,关键在于如何安装selenium模块到python环境。很多人会想这个安装很简单啊,直接一条语句就可以啦。现实与理想之间总是…

作者头像 李华