news 2026/6/2 15:28:00

零基础自建知识图谱网站——大模型问答

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
零基础自建知识图谱网站——大模型问答

这一篇我们要做一个基于知识图谱的问答功能。

为什么要这么做

相信大家都遇到过这样的困扰:跟大模型对话的时候,明明问的是客观事实,它说得也有模有样,事后一核对才发现全是瞎编。如果问题需要串联好几层信息,或者涉及到专业领域,比如梳理人物关系、事件脉络,回答更是漏洞百出、逻辑混乱。

想要解决这些痛点,就可以把知识图谱和大模型问答结合在一起。知识图谱提供知识底座,大模型通过设限来约束其发挥,就可以生成相对准确的答案。

把我们的知识图谱接入大模型后,优势会非常明显:

  • 最重要的优势是杜绝专业领域的胡编乱造;

  • 可以解决复杂问题:面对需要梳理关联、追溯脉络的提问,它能顺着知识网络一步步解答,不会答非所问;

  • 方便维护:如果后续有新知识补充、旧内容修正,只需要改动知识图谱里对应的条目即可,不用费心训练模型,省时又省力。

基于知识图谱的大模型问答

好了接下来开始动手做。老方法,直接让AI干活:

我想做一个基于知识图谱的大模型问答,请帮我做一个出来

这次Trae出了bug,会话卡住了,强制关掉后继续,方案没了,不过它自动给做出来了:

还是让它补一下方案吧,很详细,实体的精准检索、模糊检索、多跳关联等都自动给做出来了,问答也严格限制了只能回答图谱里有的内容:

不仅可以正常问答,还会显示参考实体和关系,点击实体可以在首页显示,很棒!

历史记录也能正确显示:

不过它把“智能问答”这个放到了第二屏,我想让这栏一直在第一屏,改动一下:

好了,把图谱干没了,继续修。现在因为使用Vite做前端服务,还有Neo4j做图谱服务,每次出问题排查需要的时间都会很长,不管没关系,让AI做就是了。

期间又发生了诸如网址无法访问、图谱无法问答、图谱继续不显示等bug,还挺消耗人的,大家如果有科技,建议直接上Codex或者Claude Code,别的不说,心情会变好。

问答优化

问答功能已经可以正常运转了,但是仔细想一下,问题还是挺多的:

  • 严格基于知识图谱,无任何发散。

  • 每轮对话只能问一个问题,没有上下文管理。

  • 实体检索无同义词发散,比如大模型匹配“高祖”,不会搜到“沛公”、“刘邦”这些词。

  • 无法按照类型检索,比如问:“沛县出来哪些人物”,它只会去匹配“人物”两个字。

  • 对话历史在服务重启后就消失了。

  • 每个实体仅获取前20条关联实体(对于刘邦这种实体,获取数据会丢失)。

  • 对话框输入文本太长了不会换行

  • 性能问题(每个关键词都全量查询,可以减少检索次数;上下文长度无优化,可能会过长,增加token消耗;大模型调用错误直接失败,无自动重试)。

我们来一条条优化。

首先放宽模型基于知识图谱的限制:

我想让大模型在读取完知识图谱的基础上, 可以根据模型自身的数据进行整合和补全

它出了一个方案:

测试一下,由于现在数据还很少,还没到刘邦和项羽撕破脸,模型帮我们补全了后来的东西:

接下来增加上下文和追问功能。现在问答智能问一次,不能追问,也不能新建对话,加上这个功能:

加上上下文功能, 每次问答不要新开一次问答, 直接在上一次追问, 同时新加入一个“新问答”按钮, 用来新开问答

看看效果:

还挺像样的!

接下来优化检索词,加上“同义词发散”和“类型检索”这两个功能:

可以把“汉高祖”和“刘邦”对应上,也可以根据“人物”这个关键字去图谱中搜索,效果还可以。

接下来优化历史对话:

刷新也不会丢失历史记录了。

然后优化大模型获取的实体数量,整体提高通过实体获取其关系的数量:

然后是对话框不会换行的问题,我希望改成文本可换行,如果换行就自动扩大文本框,最多三行:

最后优化3项性能问题,可以提升问答速度、减少token消耗、优化用户体验:

来看看优化后的网页吧:

差不多是我想象中的样子了,虽然没有用专业的工具(GraphRAG),也算是自己动手的平替了。

把我们的最终版本提交到gitee吧,让AI先执行前置操作,我们进入wsl中,到项目的地址,输入git push就行了:

网址在这里,已经开源:

https://gitee.com/Archaic_Revival/ancient-book-knowledge-graph

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/2 15:27:16

从路径混乱到清晰管理:一个Python数据科学项目的文件保存最佳实践

从路径混乱到清晰管理:一个Python数据科学项目的文件保存最佳实践引言:为什么文件管理在数据科学中如此重要?在数据科学项目中,我们常常花费大量时间调试模型、优化算法,却容易忽视一个看似简单却至关重要的问题——文…

作者头像 李华
网站建设 2026/6/2 15:26:04

手机号查询QQ号:5分钟快速上手的完整免费指南

手机号查询QQ号:5分钟快速上手的完整免费指南 【免费下载链接】phone2qq 项目地址: https://gitcode.com/gh_mirrors/ph/phone2qq 还在为忘记QQ号而烦恼吗?手机号查询QQ号工具让你快速找回关联的QQ账号,无需复杂操作,只需…

作者头像 李华
网站建设 2026/6/2 15:23:27

Honey Select 2 HF Patch终极指南:3步实现完整汉化与去码功能

Honey Select 2 HF Patch终极指南:3步实现完整汉化与去码功能 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 你是否在为Honey Select 2的日文界面而…

作者头像 李华