一个会思考的招聘 Agent：基于 seekdb 构建可落地的智能简历筛选系统实践-平芜编程栈

在 AI 应用快速落地的时代，数据的统一管理与低门槛部署已成为决定项目成败的关键。近期，seekdb 宣布原生支持直接对接 Dify，这一能力极大简化了向量数据与业务元数据的维护流程——无需额外同步管道，不再依赖多套存储系统，所有信息在一个数据库中即可完成写入、检索与更新。

目前网上大多数教程聚焦于 Linux 环境下的 seekdb 部署，但对于轻量级应用或概念验证（PoC）场景，许多开发者更倾向于先在熟悉的 Windows 环境中快速跑通端到端流程。本文便以 Windows 11 为主战场，手把手演示如何高效搭建一个基于 seekdb 的智能招聘 Agent。

我们的目标很明确：

在本地部署 Dify 与 seekdb；
在 Dify 中接入大模型并构建候选人简历知识库；
创建一个能理解自然语言指令、自动筛选匹配人才的智能招聘 Agent；
同时通过 DBeaver 等标准 SQL 工具直连 seekdb，实现对向量与结构化数据的运维管理。

Windows 环境下的高效部署实践

为加速原型验证，我们在 Windows 11 环境下通过 Docker 部署 Dify 与 seekdb。得益于 Dify 3.11 版本对 seekdb 的原生支持，只需简单配置 .env 文件，即可将元数据与向量存储后端无缝切换至 seekdb：

话不多说我们可以直接下载dify最新的包进行部署，如果想部署seekdb，可以看文末的附录。在docker部署时，需要修改部分环境变量，将数据库连接改为seekdb，以下是相关操作：

cd dify

cd docker

# 复制环境变量模板

cp .env.example .env

# 设置数据库类型为 mysql, 并且修改元数据库连接信息

DB_TYPE=mysql

DB_USERNAME=root

DB_HOST=seekdb

DB_PORT=2881

DB_DATABASE=test

# 设置向量存储为 OceanBase

VECTOR_STORE=oceanbase

# 修改OCEANBASE的连接信息为seekdb的对应连接信息

OCEANBASE_VECTOR_HOST=seekdb

OCEANBASE_VECTOR_USER=root

# 修改 COMPOSE_PROFILES 为seekdb

COMPOSE_PROFILES=seekdb

然后运行docker compose up -d ，发现seekdb一直处于waiting状态，查docker

我进seekdb的容器，找了下obshell的日志，发现并没有关键信息：

再看volumes/seekdb/log的日志：

ERROR[SERVER] init (ob_server.cpp:538) [70][observer][T0][Y0-0000000000000001-0-0] [lt=83][errcode=-4016] [server_start2/18] observer init fail. you may find solutions in previous error logs or seek help from official technicians.

排查发现 observer 启动失败且无明确原因，经大模型分析日志定位到是重命名操作权限问题。这并非 SeekDB 本身的缺陷，而是 Windows/Mac 系统与 Docker 容器的文件系统规则不兼容导致的历史问题。

这个问题至今没有解决，有兴趣的小伙伴可以跟进下：You cannot rename files and folders in mounted directories, another problem that has persisted for 4 years #147

Unable to move files in volume directory in Windows docker container #1058

那该如何解决呢？有一个方案就是把数据卷挂载到wsl里，这样docker哪怕出问题，数据还在wsl里，但是对于我们搭windows版本主要是为了做个demo，所以直接把挂载去除就行了。

这样就能顺利把seekdb的镜像启起来了，然后我们发现sandbox启动失败，也是类似原因，我们把sandbox的挂载也注释掉：

好了，Dify终于部署好了，输入http://127.0.0.1 ，就能访问dify，第一次登录会让你注册一个账户，按要求填好就能进入：

构建智能简历筛选 Agent实践

现在开始搭建候选人筛选Agent，我们首先要配置大模型信息，然后再搭建候选人的知识库，最后再搭建应用。

接入大模型和词向量模型：

点击右上角的个人头像，点击设置，点击模型供应商，根据你的情况，选择相应的模型供应商并配置模型。这里就以火山大模型服务作为案例，火山每个模型都有50w的免费tokens，开始做demo的时候，不充值也能使用。这里我们选择最新的DeepseekV3.2和豆包自己的词向量模型doubao-embedding-large。

下面先安装火山方舟的模型供应商，然后在里面配置大模型信息和词向量模型信息。

2、创建候选人知识库：

先在页面最上方，选择知识库，创建一个候选人知识库，并把所有的候选人简历拖进去，下面是知识库的配置：

其中有几个要点：

文本分块，因为这个项目是候选人筛选，因此候选人整个简历都要作为上下文喂给大模型进行分析，所以要用“父子分段”，子段用于检索，父段用于上下文。
其中topK最大只能选10，即在召回时最多只能返回10个文本块，如果你的候选人数据十分的多，那符合你筛选条件的也会很多，加上RAG返回的是块，一个候选人的信息可能被切成了多个块，所以我们可以增加TOPK的上限，如果要增加，需要修改下dify的env，将TOPK的最大值调为50

# The maximum number of top-k value for RAG.

TOP_K_MAX_VALUE=50

点击保存并继续后，dify就会自动调用词向量模型来进行处理，过一段时间全部文件处理完毕后，知识库可以正常使用。

3、创建候选人筛选应用

在 Dify 工作室中创建“聊天助手”型应用，绑定候选人知识库并编写提示词（Prompt），即可实现自然语言驱动的智能筛选。例如，输入“寻找有 3 年以上 Java 微服务经验、熟悉 Kubernetes 的后端工程师”，系统能自动召回匹配度最高的候选人，并生成结构化推荐理由。测试没问题后，点击右上角发布，即可保存并发布该AI应用。

三、数据可运维：seekdb赋能业务闭环

seekdb 允许我们通过标准 SQL 工具（如 DBeaver）直接访问数据。无论是调试分块效果、修正错误嵌入，还是导出筛选结果进行人工复核，都能在同一个数据库中完成。这种透明、可干预、可审计的特性，让 AI 筛选不再是“魔法”，而是可解释、可优化的业务流程。这里我们使用dbeaver来查看数据，因为老版本没有做oceanbase的数据库连接方式，需要升级到新版的dbeaver，我这里用的是 25.3.0。

按下面方式填写，这里的密码是dify env中的密码，没改的话，默认是difyai123456。

连接后可以就可以直接维护里面的数据了，比如如果对知识库分词不满意的话，可以写个脚本直接连接seekdb进行处理，也可以把这个脚本做成一个工作流放在dify中。

四、结语：seekdb，让智能 Agent 真正“看得见、管得住、跑得快”

在 AI 应用从“能用”迈向“好用”的关键阶段，技术的价值不再仅由模型精度定义，而取决于它能否无缝融入真实业务流程、被一线团队高效使用。seekdb 正是在这一背景下脱颖而出——它不只是一个支持向量检索的数据库，它更像是一个all-in-one的数据中枢。

在本次候选人筛选 Agent 的实践中，seekdb 带来了四大关键价值：

效率跃升：将原本耗时数小时的人工筛选压缩至秒级响应；
决策更准：通过语义级匹配，显著降低因关键词局限导致的优质人才漏筛；
成本可控：单机即可运行，结构化数据与向量统一存储，彻底告别复杂的 ETL 链路；
敏捷验证：即便在 Windows 11 这样的非传统 AI 开发环境，也能快速完成端到端部署，让创意当天落地、当天验证。

另外，得益于seekdb良好的生态兼容特性，我们借助 DBeaver 等通用工具直连 seekdb，我们实现了对 Agent 数据的可视化管理——无论是调试分段效果、修正嵌入偏差，还是导出筛选结果供 HR 复核，一切操作都透明、可干预、可追溯。这使得 AI 不再是黑盒，而是可信任、可迭代、可运营的业务伙伴。

未来，这套以 seekdb 为底座、Dify 为引擎、Agent 为交互入口的系统，将轻松扩展至人才盘点、岗位智能推荐、高潜识别乃至离职风险预警等更多 HR 场景。

附：seekdb桌面版安装

如果不想用docker里的seekdb，也可以直接安装一个，windows有桌面版，下面是安装过程：

如果要安装windows版本的seekdb，第一步是安装wsl，因为我之前安装了docker已经有wsl，所以这里不展开了，有需要的可以参考这篇文章https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002866370。

访问 OceanBase 软件下载中心（https://www.oceanbase.com/softwarece），找到 OceanBase桌面版一键部署安装包，单击下载 Windows 版-1.3。

安装时发现报错，提示CPU虚拟化失败：

但我查看CPU虚拟化是开着的，问了AI后，发现是因为PowerShell 执行策略的修改未覆盖到用户级配置，于是执行以下操作：以管理员身份打开 PowerShell，执行以下命令（覆盖当前用户和本地计算机的策略）：

# 设置当前用户的执行策略为RemoteSigned（更安全且兼容）

Set-ExecutionPolicy -Scope CurrentUser -ExecutionPolicy RemoteSigned -Force

安装完成后，打开桌面版，会自动启动数据库。

进入 obshell Dashboard 页面后，实例自动启动，您可以在该页面查看实例的信息以及进行实例管理。