news 2026/2/14 0:34:42

打造AI时代智能知识库:Obsidian+Dify向量检索全攻略(附插件下载)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
打造AI时代智能知识库:Obsidian+Dify向量检索全攻略(附插件下载)

本文详细介绍了如何将Obsidian与Dify知识库相结合,打造基于向量存储的AI友好知识系统。作者开发了自定义同步插件,解决了Obsidian原生搜索对AI不友好的问题,实现了语义检索功能。文章涵盖Dify知识库创建、Embedding模型配置、API密钥获取,以及Obsidian插件安装配置的全过程,最终通过n8n工作流演示知识库调用方法,构建了从知识生产到存储再到消费的完整闭环。


最近我把 Obsidian 打造成了一个中心知识库,然后把我所有进行内容生成的工具,如扣子空间、Trae、n8n、Coze 全部跟它进行了打通。现在我只需要维护这一套知识库,所有下游的 AI 工具就都能调用到了。

然而,在使用过程中我发现,Obsidian 原生的搜索方式对 AI 其实并不友好。特别是当内容量变大以后,仅靠关键词匹配,知识调用的准确率非常低。

举个最常见的例子:明明我的知识库里有一篇名为“Obsidian使用说明”的文章。当我问 AI:“Obsidian如何安装?”时,AI 可能会提取“Obsidian安装”这个关键词去搜索。结果呢?Obsidian 告诉我“找不到”!

为什么?因为文件名里没有“安装”这两个字。虽然我们可以通过 Prompt 让 AI 多尝试几次,但这种“碰运气”的方式效率太低,经常导致 AI 无法获取到关键资料。

而专业的知识库,通常会使用向量数据库技术。它会将知识通过大模型处理,转化为语义向量进行存储。通过这种技术,当我们搜索“Obsidian如何安装”时,系统通过语义匹配,就能自动关联到“Obsidian使用说明”、“Obsidian配置”等含义相近的内容。

这才是 AI 时代的知识库该有的样子。

为了让我的众多 AI Agent 能更精准地调用中心知识库,我决定引入一个基于向量存储的知识库。经过一番调研,我最终选择了 Dify —— 它开源、生态成熟,且相对可靠。

选定 Dify 后,摆在我面前的问题就是:如何把 Obsidian 里的笔记自动同步到 Dify?

这也正是我喜欢 Obsidian 的原因:它的自由度太高了!如果是其他笔记软件,不支持 Dify 同步可能就只能手动“下载-上传”了,每写一篇笔记都要折腾一次,想想都头大。

但在 Obsidian 里,我们可以利用插件解决。虽然翻遍了社区也没找到现成的 Dify 同步插件,但这难不倒我,索性自己写一个!

经过几天的开发和优化,我终于搞定了这个同步插件。接下来,就把完整的配置过程分享给大家。


一、知识库准备

1、创建知识库

Dify 的官网地址是 https://dify.ai,大家可以直接注册使用。不过免费空间有限,我自己是部署了开源版。

进入 Dify 后,找到顶部的“知识库”菜单,点击“创建知识库”。

因为我们稍后会从 Obsidian 同步文档过来,所以这里选择创建一个空的知识库即可。输入知识库名称,点击“创建”。

2、配置 Embedding 模型(关键)

这一步非常重要! 很多人同步失败就是因为漏了这一步。

如前所述,为了实现语义检索,我们需要用到向量化存储技术,这就需要 Embedding 模型的支持。这里我推荐使用通义千问的 Embedding 模型,性价比很高。

首先进入 Dify,点击右上角头像,选择“设置”。

点击左侧的“模型供应商”,搜索“通义”,找到并点击安装/配置。

在配置模型之前,我们需要先去 阿里云百炼平台:https://bailian.console.aliyun.com/ 申请一个 API Key。

回到 Dify,在通义千问的配置窗口中填入刚刚申请的 API Key。

配置完成后,找到“系统模型设置”,将 Embedding 模型 的默认模型设置为通义千问的模型(例如 text-embedding-v3)。这一步不做,Obsidian 里的文档是传不上去的。

3、获取知识库 ID 和 API 密钥

打开我们刚刚创建好的知识库。

看浏览器地址栏,URL 中 datasets/ 后面那一串字符就是 知识库 ID,把它复制保存下来,后面要用。

接着点击左侧菜单的“API 密钥”,右上角的 API 端点是我们的请求地址(记下来)。然后点击“创建密钥”,生成一个新的 API Key 并保存。


二、Obsidian 同步配置

知识库准备好了,接下来就是配置 Obsidian,让它能一键把笔记同步过去。

因为找不到现成的插件,我找了一份开源代码,并在此基础上进行了重构和优化,完美实现了增量同步功能。

插件获取方式请看文末!

1、安装插件

按照下图指示,点击 Obsidian 设置里的“打开插件文件夹”。

将下载解压后的插件文件夹放入这个目录中。

回到 Obsidian 的“第三方插件”页面,点击刷新,就能看到 Dify Sync 插件了。启用它,并点击齿轮图标进入配置页面。

2、配置插件

进入配置页后,主要填写三个参数(就是我们在第一部分第 3 步获取的那些):

  • Dify API URL:这里注意,只需要填域名即可,不要带 /v1 后缀(例如 http://localhost:5000 或你的公网地址)。
  • DIfy API 秘钥:填入 Dify 知识库的密钥。
  • DIfy 知识库 ID:填入知识库 ID。

其他选项(如自动同步间隔、同步文件夹限制)可以根据自己的需求设置。

配置无误后,点击侧边栏或命令面板中的“同步到 Dify”按钮。Obsidian 就会开始工作,将你的笔记一键同步到 Dify 中。

看,文档已经全部同步上来了!


三、使用知识库实战

知识库搭建好了,怎么用呢?

核心思路就是利用 Dify 提供的 API 来检索知识。这里我用 n8n 做一个简单的演示,展示如何在工作流中调用这个知识库。

首先,在 n8n 里搭建一个简单的 AI Agent 工作流:

我们需要在 AI Agent 的“Tools”部分,挂载我们的 Dify 知识库。点击 Tool 下方的 + 号,添加一个 HTTP Request 节点。

接下来,打开 Dify 的 API 文档(在知识库页面左侧有入口),找到“知识库检索”接口,点击右侧复制 cURL 代码。

回到 n8n,双击 HTTP 节点,点击“Import cURL”,把刚才复制的代码粘贴进去导入。

导入后,记得把参数修改为你自己的信息:

  • URL:如果你是私有部署的,要把前面的域名换成你自己的 Dify 地址。
  • Authorization:确认 API Key 是否正确。

然后修改请求体(Body)中的 query 参数。我们要让 AI 根据上下文自动生成搜索词,所以这里填入 {{ $fromAI(“query”) }}。

⚠️ 这里有个坑需要注意:

Dify 的知识库支持多种检索模式。如果不指定参数,默认可能会使用“混合检索”,这要求你在 Dify 知识库设置里开启“高质量”模式。

如果你没有开启高质量模式,或者只想用关键词检索,建议在 Body 里显式指定检索模式。完整的 JSON 参数参考如下:

{ "query":"{{ $fromAI('query') }}","retrieval_model":{ "search_method":"keyword_search", "reranking_enable":true, "top_k":3, "score_threshold_enabled":true, "score_threshold":0.5, "weights":0.7}}

最后,别忘了给这个 HTTP 工具写一个详细的 Description(工具描述)。告诉 AI 这个工具是干嘛的、怎么用。

AI Agent 的 System Prompt(系统提示词)也需要相应调整,引导它在遇到不知道的问题时去调用这个工具。

测试一下:

我询问了一个关于 Obsidian 的具体问题,AI Agent 自动分析意图,调用了知识库检索接口,并根据检索到的信息给出了回答。

完美!至此,从 知识生产(Obsidian) 到 知识存储(Dify) 再到 知识消费(n8n/AI Agent) 的闭环彻底打通了。


如何系统的学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

01.大模型风口已至:月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长,根据工信部最新数据:

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K(数据来源:BOSS直聘报告)

70%企业存在"能用模型不会调优"的痛点

真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!

02.大模型 AI 学习和面试资料

1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)





第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/6 23:55:28

python 学习笔记(文件和目录操作)

创建目录 os.makedirs可以递归的创建目录结构。 import os os.makedirs(tmp/python/test,exist_okTrue) #exit_ok True指定了,如果某个要创建的目录已经存在,也不报错删除文件或目录 os.remove 可以删除一个文件 os.remove(test.py)**shutil.rmtree()**…

作者头像 李华
网站建设 2026/2/12 23:53:44

实验一 安全威胁与攻击实验

一、实验目的安全威胁与攻击实验与理论教学第一章信息安全概论相对应。本实验在学生完成MAC地址欺骗攻击与防御实验、OSPF路由项欺骗攻击和防御实验的基础上,使学生能够理解威胁、攻击、资产的关系,并理解基本安全设计原则的重要性。具体如下&#xff1a…

作者头像 李华
网站建设 2026/2/14 6:10:13

二十一、pinctrl子系统

前言 前面我们写的GPIO驱动程序都是自己在驱动里面定义好gpio引脚需要用到的寄存器,然后在驱动程序里面直接去配置这些寄存器。Linux是一个成熟的,跨平台的通用操作系统,对于配置引脚这样的最基本的功能,是已经有一套现成的框架可…

作者头像 李华
网站建设 2026/2/12 19:26:45

Java Web 社区医院信息平台系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

摘要 随着信息技术的快速发展,传统社区医院的管理模式已难以满足现代医疗服务的需求。社区医院在日常运营中涉及患者信息管理、医生排班、药品库存、预约挂号等多方面业务,传统的手工记录或单机系统存在效率低下、数据易丢失、信息共享困难等问题。为了提…

作者头像 李华
网站建设 2026/2/13 16:36:43

基于SpringBoot+Vue的IT交流和分享平台管理系统设计与实现【Java+MySQL+MyBatis完整源码】

摘要 随着互联网技术的快速发展,IT技术交流与知识分享的需求日益增长。传统的技术论坛和社交媒体平台虽然提供了基础的交流功能,但在专业性、系统性和用户体验方面仍有较大提升空间。尤其是在技术问答、资源共享和项目管理等方面,缺乏高效的整…

作者头像 李华