在 AI 应用快速落地的时代,数据的统一管理与低门槛部署已成为决定项目成败的关键。近期,seekdb 宣布原生支持直接对接 Dify,这一能力极大简化了向量数据与业务元数据的维护流程——无需额外同步管道,不再依赖多套存储系统,所有信息在一个数据库中即可完成写入、检索与更新。
目前网上大多数教程聚焦于 Linux 环境下的 seekdb 部署,但对于轻量级应用或概念验证(PoC)场景,许多开发者更倾向于先在熟悉的 Windows 环境中快速跑通端到端流程。本文便以 Windows 11 为主战场,手把手演示如何高效搭建一个基于 seekdb 的智能招聘 Agent。
我们的目标很明确:
- 在本地部署 Dify 与 seekdb;
- 在 Dify 中接入大模型并构建候选人简历知识库;
- 创建一个能理解自然语言指令、自动筛选匹配人才的 智能招聘 Agent;
- 同时通过 DBeaver 等标准 SQL 工具直连 seekdb,实现对向量与结构化数据的运维管理。
- Windows 环境下的高效部署实践
为加速原型验证,我们在 Windows 11 环境下通过 Docker 部署 Dify 与 seekdb。得益于 Dify 3.11 版本对 seekdb 的原生支持,只需简单配置 .env 文件,即可将元数据与向量存储后端无缝切换至 seekdb:
话不多说我们可以直接下载dify最新的包进行部署,如果想部署seekdb,可以看文末的附录。在docker部署时,需要修改部分环境变量,将数据库连接改为seekdb,以下是相关操作:
cd dify
cd docker
# 复制环境变量模板
cp .env.example .env
# 设置数据库类型为 mysql, 并且修改元数据库连接信息
DB_TYPE=mysql
DB_USERNAME=root
DB_HOST=seekdb
DB_PORT=2881
DB_DATABASE=test
# 设置向量存储为 OceanBase
VECTOR_STORE=oceanbase
# 修改OCEANBASE的连接信息为seekdb的对应连接信息
OCEANBASE_VECTOR_HOST=seekdb
OCEANBASE_VECTOR_USER=root
# 修改 COMPOSE_PROFILES 为seekdb
COMPOSE_PROFILES=seekdb
然后运行docker compose up -d ,发现seekdb一直处于waiting状态,查docker
我进seekdb的容器,找了下obshell的日志,发现并没有关键信息:
再看volumes/seekdb/log的日志:
ERROR[SERVER] init (ob_server.cpp:538) [70][observer][T0][Y0-0000000000000001-0-0] [lt=83][errcode=-4016] [server_start2/18] observer init fail. you may find solutions in previous error logs or seek help from official technicians.
排查发现 observer 启动失败且无明确原因,经大模型分析日志定位到是重命名操作权限问题。这并非 SeekDB 本身的缺陷,而是 Windows/Mac 系统与 Docker 容器的文件系统规则不兼容导致的历史问题。
这个问题至今没有解决,有兴趣的小伙伴可以跟进下:You cannot rename files and folders in mounted directories, another problem that has persisted for 4 years #147
Unable to move files in volume directory in Windows docker container #1058
那该如何解决呢? 有一个方案就是把数据卷挂载到wsl里,这样docker哪怕出问题,数据还在wsl里,但是对于我们搭windows版本主要是为了做个demo,所以直接把挂载去除就行了。
这样就能顺利把seekdb的镜像启起来了,然后我们发现sandbox启动失败,也是类似原因,我们把sandbox的挂载也注释掉:
好了,Dify终于部署好了,输入http://127.0.0.1 , 就能访问dify,第一次登录会让你注册一个账户,按要求填好就能进入:
- 构建智能简历筛选 Agent实践
现在开始搭建候选人筛选Agent,我们首先要配置大模型信息,然后再搭建候选人的知识库,最后再搭建应用。
- 接入大模型和词向量模型:
点击右上角的个人头像,点击设置,点击模型供应商,根据你的情况,选择相应的模型供应商并配置模型。这里就以火山大模型服务作为案例,火山每个模型都有50w的免费tokens,开始做demo的时候,不充值也能使用。这里我们选择最新的DeepseekV3.2和豆包自己的词向量模型doubao-embedding-large。
下面先安装火山方舟的模型供应商,然后在里面配置大模型信息和词向量模型信息。
2、创建候选人知识库:
先在页面最上方,选择知识库,创建一个候选人知识库,并把所有的候选人简历拖进去,下面是知识库的配置:
其中有几个要点:
- 文本分块,因为这个项目是候选人筛选,因此候选人整个简历都要作为上下文喂给大模型进行分析,所以要用“父子分段”,子段用于检索,父段用于上下文。
- 其中topK最大只能选10,即在召回时最多只能返回10个文本块,如果你的候选人数据十分的多,那符合你筛选条件的也会很多,加上RAG返回的是块,一个候选人的信息可能被切成了多个块,所以我们可以增加TOPK的上限,如果要增加,需要修改下dify的env,将TOPK的最大值调为50
# The maximum number of top-k value for RAG.
TOP_K_MAX_VALUE=50
点击保存并继续后,dify就会自动调用词向量模型来进行处理,过一段时间全部文件处理完毕后,知识库可以正常使用。
3、创建候选人筛选应用
在 Dify 工作室中创建“聊天助手”型应用,绑定候选人知识库并编写提示词(Prompt),即可实现自然语言驱动的智能筛选。例如,输入“寻找有 3 年以上 Java 微服务经验、熟悉 Kubernetes 的后端工程师”,系统能自动召回匹配度最高的候选人,并生成结构化推荐理由。测试没问题后,点击右上角发布,即可保存并发布该AI应用。
三、数据可运维:seekdb赋能业务闭环
seekdb 允许我们通过标准 SQL 工具(如 DBeaver)直接访问数据。无论是调试分块效果、修正错误嵌入,还是导出筛选结果进行人工复核,都能在同一个数据库中完成。这种透明、可干预、可审计的特性,让 AI 筛选不再是“魔法”,而是可解释、可优化的业务流程。这里我们使用dbeaver来查看数据,因为老版本没有做oceanbase的数据库连接方式,需要升级到新版的dbeaver,我这里用的是 25.3.0。
按下面方式填写,这里的密码是dify env中的密码,没改的话,默认是difyai123456。
连接后可以就可以直接维护里面的数据了,比如如果对知识库分词不满意的话,可以写个脚本直接连接seekdb进行处理,也可以把这个脚本做成一个工作流放在dify中。
四、结语:seekdb,让智能 Agent 真正“看得见、管得住、跑得快”
在 AI 应用从“能用”迈向“好用”的关键阶段,技术的价值不再仅由模型精度定义,而取决于它能否无缝融入真实业务流程、被一线团队高效使用。seekdb 正是在这一背景下脱颖而出——它不只是一个支持向量检索的数据库,它更像是一个all-in-one的数据中枢。
在本次候选人筛选 Agent 的实践中,seekdb 带来了四大关键价值:
- 效率跃升:将原本耗时数小时的人工筛选压缩至秒级响应;
- 决策更准:通过语义级匹配,显著降低因关键词局限导致的优质人才漏筛;
- 成本可控:单机即可运行,结构化数据与向量统一存储,彻底告别复杂的 ETL 链路;
- 敏捷验证:即便在 Windows 11 这样的非传统 AI 开发环境,也能快速完成端到端部署,让创意当天落地、当天验证。
另外,得益于seekdb良好的生态兼容特性,我们借助 DBeaver 等通用工具直连 seekdb,我们实现了对 Agent 数据的可视化管理——无论是调试分段效果、修正嵌入偏差,还是导出筛选结果供 HR 复核,一切操作都透明、可干预、可追溯。这使得 AI 不再是黑盒,而是可信任、可迭代、可运营的业务伙伴。
未来,这套以 seekdb 为底座、Dify 为引擎、Agent 为交互入口的系统,将轻松扩展至人才盘点、岗位智能推荐、高潜识别乃至离职风险预警等更多 HR 场景。
附:seekdb桌面版安装
如果不想用docker里的seekdb,也可以直接安装一个,windows有桌面版,下面是安装过程:
如果要安装windows版本的seekdb,第一步是安装wsl,因为我之前安装了docker已经有wsl,所以这里不展开了,有需要的可以参考这篇文章https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002866370。
访问 OceanBase 软件下载中心(https://www.oceanbase.com/softwarece),找到 OceanBase桌面版一键部署安装包,单击下载 Windows 版-1.3。
安装时发现报错,提示CPU虚拟化失败:
但我查看CPU虚拟化是开着的,问了AI后,发现是因为PowerShell 执行策略的修改未覆盖到用户级配置,于是执行以下操作:以管理员身份打开 PowerShell,执行以下命令(覆盖当前用户和本地计算机的策略):
# 设置当前用户的执行策略为RemoteSigned(更安全且兼容)
Set-ExecutionPolicy -Scope CurrentUser -ExecutionPolicy RemoteSigned -Force
安装完成后,打开桌面版,会自动启动数据库。
进入 obshell Dashboard 页面后,实例自动启动,您可以在该页面查看实例的信息以及进行实例管理。