news 2026/3/15 2:46:04

AI技术突破:港中大WeChat AI联合出品HGMem,让大模型在100k+长文本中也能全局推理,成本还不增加!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI技术突破:港中大WeChat AI联合出品HGMem,让大模型在100k+长文本中也能全局推理,成本还不增加!
https://github.com/Encyclomen/HGMemImproving Multi-Step RAG with Hypergraph-Based Memory for Long-Context Complex Relational Modeling https://arxiv.org/pdf/2512.23959

港中大 &WeChat AI联合团队

RAG双重暴击:“超长+全局推理”

传统 RAG 的痛点具体表现
单步检索只能“点到点”找答案,跨章节、跨事件关联无力
工作记忆=简单摘要用一段流水账plain text 记录历史,丢细节、丢引用、丢结构
图记忆最多二元关系(A→B),无法表达“三元及以上”高阶关联

结果:在 100k+ token 的金融/法律/小说类文档里,一旦问题需要“全局 sense-making”(例如“为什么 Xodar 被送给 Carter 当奴隶?”),现有方法就像拼图只拼边缘,中间永远缺一块。

HGMEM——把“记忆”升级成“超图”

图1:左侧为第 t 步交互流程;右侧为超图记忆的演化示意

2.1 核心思想

把“工作记忆”不再当成一块硬盘,而是一张可动态生长、可高阶连接的超图

  • 每个超边(hyperedge)= 一个“记忆点”,可一次性连接 ≥2 个实体
  • 支持三种原子操作:Update ∣ Insert ∣ Merge
  • 每一步先“自我检查”→ 决定局部深挖 or 全局探索 → 检索 → 用 LLM 把新证据合并成更高阶的超边

2.2 关键模块一览

模块作用与传统做法差异
超图存储hypergraph-db实时维护节点 & 超边不再是 plain text 或二元图
自适应检索Local Investigation ↔ Global Exploration 切换先“查周边”再“开新地图”,减少冗余
记忆合并把多条低阶事实熔成一条高阶关系二元图做不到 n-ary 融合
子查询生成LLM 基于当前超图拓扑自动出题避免人工模板

图2 记忆演化案例

图2:Cowslip Moth 案例中,三条低阶事实被合并成一条“昆虫-植物共生”高阶关系

实验:成绩与成本双赢

3.1 主要结果

在 4 个超长文档基准(NarrativeQA / NoCha / Prelude / LongBench-V2)上,同样用 GPT-4o 或 Qwen-32B 做 backbone,HGMEM 全线 SOTA

表1:↑ 表示合并操作带来的高阶关联对“sense-making”类问题尤为关键

3.2 成本对比

与同样带工作记忆的 DeepRAG / ComoRAG 相比,HGMEM 平均 token 消耗与延迟几乎持平,并未因“超图”而额外增负:

表5 在线开销对比

表5:合并操作仅增加 <7% token,却带来显著精度提升

一句话总结

HGMEM 把“记忆”从静态硬盘升级成动态超图,让大模型在超长文本里像侦探一样层层抽丝、合并线索、全局破案,而且不增成本——多步 RAG 的“记忆”就该这么玩!

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/14 15:53:57

HTML页面集成AI语音:使用GLM-TTS提升网页交互体验

HTML页面集成AI语音&#xff1a;使用GLM-TTS提升网页交互体验 在智能客服越来越“聪明”的今天&#xff0c;你有没有注意到——它们的声音还是那么机械、冰冷&#xff1f;即便能准确回答问题&#xff0c;那种毫无情感起伏的朗读腔调&#xff0c;依然让人难以产生信任感。这正是…

作者头像 李华
网站建设 2026/3/13 9:37:28

GLM-TTS二次开发指南:科哥微信312088415提供的扩展接口说明

GLM-TTS二次开发实战指南&#xff1a;从音色克隆到批量生成的工程化路径 在智能语音内容爆发式增长的今天&#xff0c;传统TTS系统面对个性化、高保真和快速迭代的需求已显得力不从心。一个典型场景是&#xff1a;某教育科技公司需要为AI教师定制专属声音&#xff0c;既要还原真…

作者头像 李华
网站建设 2026/3/12 23:38:47

收藏!2025 AI高薪浪潮来袭:大模型学习入门指南(小白/程序员必看)

1、硬核数据佐证&#xff1a;2025 AI人才市场进入“岗位追着人跑”新时代 别再把“年薪百万”当成科技圈大佬的专属光环——2025年的AI人才赛道&#xff0c;早已实现“高薪常态化、抢人白热化”。脉脉最新发布的《2025年AI人才流动报告》&#xff0c;用一组组真实数据&#xff…

作者头像 李华
网站建设 2026/3/9 0:13:24

无人机射频模块技术要点解析

无人机射频模块是其通信系统的核心&#xff0c;它负责在无人机、遥控器和地面站之间建立并维持一条稳定、高效、可靠的无线数据链路。其技术设计直接决定了无人机的控制距离、图像传输质量、抗干扰能力和整体可靠性。为了快速建立整体认知&#xff0c;下表汇总了当前主流及前沿…

作者头像 李华
网站建设 2026/3/4 11:16:15

无需编程基础!手把手教你用GLM-TTS webUI实现语音克隆

无需编程基础&#xff01;手把手教你用GLM-TTS webUI实现语音克隆 在短视频、播客和虚拟人内容爆发的今天&#xff0c;个性化语音正在成为数字表达的新入口。你是否想过&#xff0c;只用一段几秒钟的录音&#xff0c;就能让AI“说”出你想说的话&#xff1f;而且全程不写一行代…

作者头像 李华