news 2026/2/9 12:54:04

Milvus 2.6.1 CAGRA:GPU建索引+CPU查,成本腰斩性能不减

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Milvus 2.6.1 CAGRA:GPU建索引+CPU查,成本腰斩性能不减

Milvus上的CAGRA有什么不同?

尽管GPU在图索引构建阶段优势显著,但在实际生产环境中,GPU资源通常比CPU更昂贵且稀缺。若索引构建与查询均依赖GPU,会导致一系列问题:

资源利用率低(查询请求零散,GPU大量时间空闲)

 

部署成本高(需为每个查询服务配置GPU,增加不必要的硬件成本)

扩展性受限(GPU数量限制服务实例数)

灵活性不足(无法按需切换 GPU 和 CPU )

针对这些痛点,开源向量数据库Milvus在2.6.1版本中,通过adapt_for_cpu参数,为GPU索引CAGRA推出灵活部署选项,实现GPU构建高质量图索引+CPU查询(一般用 HNSW )的混合模式,在保证索引质量的同时大幅降低部署成本。对于数据更新频率低(无需频繁重新构建索引)、查询规模大(需大量查询服务实例)、成本敏感(希望降低GPU资源投入)的场景,这是一种非常实用的解决方案。

(1)adapt_for_cpu解读

Milvus通过adapt_for_cpu

 

参数控制CAGRA索引的序列化与反序列化行为,实现构建与查询设备的灵活切换。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/4 16:39:09

LobeChat是否支持会话加密?端到端安全传输可能性

LobeChat 是否支持会话加密?端到端安全传输的可能性 在大语言模型(LLM)迅速渗透进个人生活与企业系统的当下,AI助手不再只是回答“今天天气如何”的工具,而是开始处理诸如医疗咨询、法律建议、财务规划等高度敏感的对…

作者头像 李华
网站建设 2026/2/7 16:58:58

ensp下载官网功能类比:网络仿真与AI推理有何共通点?

网络仿真与AI推理的深层共鸣:从eNSP到Qwen3-32B的系统思维演进 在智能系统设计的前沿,我们正见证一场静默却深刻的范式迁移。工程师们早已习惯用eNSP(Enterprise Network Simulation Platform)这样的工具,在虚拟环境中…

作者头像 李华
网站建设 2026/2/5 8:44:39

n8n 教程(三)用 n8n + 飞书,打造你的第一个“自动化助理”系列

准备工作:我们的“武器库” n8n: 自动化的“大脑”。(前文有详细介绍 Docker 本地部署,安全又免费) 飞书账号: 自动化的“手脚”。 一点点耐心: 跟着我做,保证通关! 1:在飞书“生”一个机器人 首先,我们要去飞书开放平台“领养”一个机器人。 1.1 登录 飞书开放…

作者头像 李华
网站建设 2026/2/3 5:14:12

利用Qwen3-14B进行多步骤任务规划的实践案例分享

利用Qwen3-14B进行多步骤任务规划的实践案例分享 在企业智能化转型加速的今天,一个客服系统是否“聪明”,不再仅仅取决于它能多快回复“您好,请问有什么可以帮您?”——真正的挑战在于:当用户说“我三个月前订的设备还…

作者头像 李华
网站建设 2026/2/3 11:03:19

多设备兼容与数智协同:解码低空飞行规模化应用背后的技术支撑

在低空飞行活动日益频繁、应用场景持续丰富的背景下,飞行服务需要跳出单一工具调度的局限,形成安全、高效、开放的飞行服务生态。星图云开放平台基于海量政府、企业和个人用户的低空飞行需求,打造多设备兼容和数智协同的智航低空飞行应用平台…

作者头像 李华