news 2026/4/11 0:40:14

不确定知识图谱(UKGs)增强中医药大模型:药食同源个性化膳食推荐的智能化新突破

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
不确定知识图谱(UKGs)增强中医药大模型:药食同源个性化膳食推荐的智能化新突破

文章介绍了Yaoshi-RAG框架,通过构建药食同源知识图谱和检索增强生成技术,显著提升了大语言模型在中医药食同源膳食推荐方面的准确性和可靠性。研究团队使用多源数据构建了包含24,984个实体的药食同源知识图谱,实验证明DeepSeek-R1模型性能最佳,Hits@1达到84.2%。该框架为传统中医智慧与现代AI技术的融合提供了新路径。


Leveraging Retrieval-Augmented Large Language Models for Dietary Recommendations With Traditional Chinese Medicine’s Medicine Food Homology: Algorithm Development and Validation

文章摘要

研究团队开发了Yaoshi-RAG框架,通过构建药食同源知识图谱和检索增强生成技术,显著提升了大语言模型在中医药食同源膳食推荐方面的准确性和可靠性,为传统中医智慧与现代AI技术的融合开辟了新路径。

正文

引言:传统智慧遇见人工智能

中医药学中的"药食同源"理念历史悠久,强调某些物质既可作为营养食品,又可作为治疗药物,这一古老哲学在现代医疗保健系统中获得了广泛认可。然而,药食同源原理的实际应用在很大程度上依赖于中医专家的知识和人工解释,这给自动化药食同源膳食推荐带来了挑战。

虽然大语言模型(LLMs)在医疗决策支持方面显示出潜力,但它们在中医药等专业领域的表现往往受到幻觉和领域知识缺乏的限制。为了克服这些局限性,研究团队提出了一个创新的解决方案:将不确定知识图谱(UKGs)与大语言模型通过检索增强生成(RAG)技术相结合,实现了药食同源原理的结构化和忠实表示,同时增强了LLMs理解中医药知识固有不确定性和异质性的能力。

研究方法与技术创新

Yaoshi-RAG框架概述

本研究提出的Yaoshi-RAG框架是一个专门设计的RAG框架,旨在增强大语言模型基于药食同源原理生成循证膳食推荐的能力。该框架包含两个核心模块:

  1. 知识图谱构建模块:通过多源数据编译综合语料库,使用LLM驱动的开放信息提取技术构建药食同源知识图谱,并应用不确定知识图谱推理来测量提取三元组的置信度并完成缺失的三元组。

  2. 检索增强生成模块:在给定用户查询时,框架首先识别并链接查询实体到药食同源知识图谱,然后构建关系路径以便检索推理路径,随后通过后处理(包括排序和过滤)来提取最相关的推理路径,从而提高检索准确性 。

数据来源与知识图谱构建

研究团队系统性地构建了一个包含1359个相关文档的语料库,涵盖古典文献、现代中医文献、食品和草药信息、监管文件、研究论文和中医方剂等多个来源。具体分布如下:

  • 古典文献:75篇
  • 现代中医文献:228篇
  • 食品和草药信息:400篇
  • 监管文件:42篇
  • 研究论文:432篇
  • 中医方剂:182篇

[表格1:1359个文档的统计分布]

为了提高实体-关系三元组提取的效率和准确性,每个文档被分割成300个标记的段落,然后通过精心设计的提示输入到LLMs中,以解决代词指代问题并过滤掉无关内容。

实验结果与性能评估

知识图谱构建成果

构建完成的药食同源知识图谱包含24,984个实体、22种关系和29,292个三元组。这一规模庞大的知识图谱为后续的检索增强生成提供了丰富的知识基础。

模型性能比较

研究团队评估了多个主流大语言模型,包括GPT-4、LLaMA2-Chat-7B、Qwen2.5-7B和DeepSeek-R1。实验结果表明,集成药食同源知识图谱显著提高了LLMs的性能,平均Hits@1提升14.5%,F1分数提升8.7%。

在所有评估的LLMs中,DeepSeek-R1取得了最佳性能,Hits@1达到84.2%,F1分数达到71.5%。人工评估进一步验证了这些结果,确认Yaoshi-RAG在所有评估质量维度上始终优于基线模型。

评估方法

研究采用了自动化评估和人工评估相结合的方式。自动化评估使用了Hits@1和F1分数两个指标:

  • Hits@1测量排名最高的预测推荐与真实答案匹配的查询比例
  • F1分数捕获精确度和召回率的调和平均值,提供平衡的评估

人工评估则弥补了自动化评估的局限性,特别是在评估推荐的有效性、用户接受度和可解释性方面。

答案生成与提示工程

研究团队使用提示工程技术来提高LLM生成答案的准确性和相关性。提示模板包含四个关键组件:

  1. 任务规范
  2. 用户查询
  3. 检索到的推理路径
  4. 食品和菜品实体的属性

这种结构化的提示促进了外部知识的整合,提高了LLMs对药食同源原理的理解,支持生成更准确的响应。

技术优势与创新点

关键贡献

本研究的主要贡献包括:

  1. 一个集成框架,利用知识图谱增强的LLMs生成个性化和循证的药食同源膳食推荐
  2. 一种LLM驱动的开放信息提取方法,用于从异构多源数据自动构建专门针对中医药食同源的不确定知识图谱
  3. 对几种主流LLMs在药食同源膳食推荐生成方面的系统评估
  4. 实验结果和案例研究,证明所提出框架在提供个性化和专业药食同源膳食推荐方面的能力

技术创新

通过编码领域特定知识并解决与药食同源相关的不确定性,药食同源知识图谱使LLMs能够提供更个性化、循证和可靠的膳食推荐。通过测量置信度分数,可以更好地管理药食同源原理中的固有不确定性,优先考虑可靠的关系,同时减轻不太可信关系的影响。

研究局限性与未来方向

当前局限性

研究团队诚实地承认了几个局限性:

  1. 药食同源知识图谱使用开放信息提取构建,可能引入不准确性,无法涵盖药食同源原理的所有知识
  2. 研究没有专门针对关系路径生成对LLMs进行微调,这可能限制了框架的检索有效性,特别是对于涉及多种症状或条件的复杂案例

未来发展计划

研究团队计划在未来重点关注以下几个方向:

  1. 实施更有效的知识提取方法
  2. 通过额外的药食同源文献扩展知识图谱
  3. 探索优化的检索策略
  4. 微调开源LLMs以进一步提高生成膳食推荐的准确性和可靠性
结论与意义

本研究展示了Yaoshi-RAG这一新框架,通过整合不确定知识图谱增强了LLMs在生成药食同源膳食推荐方面的能力。该框架利用多步LLM调用进行开放信息提取,自动构建药食同源知识图谱,结合不确定知识图谱推理来测量现有三元组的置信度并完成缺失的三元组。

实验评估证明,DeepSeek-R1是药食同源膳食推荐生成的最佳基础模型。该框架促进了适应个人健康状况和症状需求的膳食推荐,同时考虑多样化的食材和菜品,并提供基于药食同源原理的全面解释。

这项研究不仅为传统中医智慧与先进语言模型的结合提供了有效途径,还为个性化医疗保健和精准营养领域的发展做出了重要贡献。通过将古老的中医药食同源理念与现代人工智能技术相结合,为实现更加智能化、个性化的健康管理开辟了新的可能性。

​最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 10:54:01

DataCap免费开源数据集成平台完整部署与使用指南

DataCap免费开源数据集成平台完整部署与使用指南 【免费下载链接】datacap DataCap 是数据转换、集成和可视化的集成软件。支持多种数据源,文件类型,大数据相关数据库,关系型数据库,NoSQL 数据库等。通过软件可以实现管理多种数据…

作者头像 李华
网站建设 2026/4/10 8:50:23

NVIDIA开源GPU内核模块深度解析:5大内存管理策略提升性能300%

还在为GPU内存管理头痛不已?想要让应用性能飙升却不知从何下手?NVIDIA开源GPU内核模块的内存管理机制正是你需要的性能优化工具。通过本文,你将掌握从基础分配到高级优化的完整知识体系,彻底告别内存瓶颈。 【免费下载链接】open-…

作者头像 李华
网站建设 2026/4/10 22:30:26

Open-AutoGLM升级失败频发?深度剖析兼容性断点及修复路径

第一章:Open-AutoGLM系统版本不兼容适配在部署 Open-AutoGLM 系统过程中,开发者常遇到因依赖库或核心组件版本不匹配导致的运行时异常。此类问题多出现在模型加载、推理服务启动或API调用阶段,典型表现为模块未找到错误(ModuleNot…

作者头像 李华
网站建设 2026/4/8 21:53:09

DETR模型评估指标深度解析:从原理到实战应用

DETR模型评估指标深度解析:从原理到实战应用 【免费下载链接】detr End-to-End Object Detection with Transformers 项目地址: https://gitcode.com/gh_mirrors/de/detr DETR(End-to-End Object Detection with Transformers)作为基于…

作者头像 李华
网站建设 2026/4/7 21:32:39

今年AI界大火的「上下文工程」

要是用传统“提示词思维”,AI只会机械回复:“明天可以,请问几点合适?”——看似没毛病,实则啥用没有,完全没考虑用户日程满不满、和对方关系如何。 谁还在死磕“提示词工程”?2025年AI圈早就换…

作者头像 李华