手把手教你用DeerFlow：从零开始打造智能研究报告生成系统-平芜编程栈

手把手教你用DeerFlow：从零开始打造智能研究报告生成系统

1. 这不是另一个“AI聊天框”，而是一个会自己查资料、写报告、做分析的研究员

你有没有过这样的经历：想快速了解一个新领域，比如“2025年国产大模型在金融风控中的落地进展”，结果打开搜索引擎，翻了二十页才找到三篇靠谱文章；再花一小时整理要点，写成一份像样的报告——还没完，还得配图、加数据、检查引用……整个过程耗时耗力，还容易遗漏关键信息。

DeerFlow 不是让你更快地“问问题”，而是帮你彻底跳过信息搜集、验证、整合、写作这些重复劳动。它能自动联网搜索权威信源，调用Python执行数据分析，调用MCP服务接入专业工具，最后生成结构清晰、有数据支撑、带参考来源的深度研究报告，甚至还能把报告转成播客脚本。

它不依赖你提供完整提示词，也不需要你手动拼接多个工具。你只需要输入一个研究主题，剩下的——规划步骤、分配任务、执行搜索、运行代码、撰写初稿、润色成文——全部由系统内部的多智能体协同完成。

这篇文章不讲抽象架构，不堆技术术语，就带你从镜像启动那一刻开始，一步步配置、操作、调试、优化，最终跑通一个真实的研究任务：自动生成一份关于“开源AI Agent框架对比分析”的技术报告。过程中你会看到：

它怎么判断该先搜论文还是先跑代码？
为什么生成的报告里既有网页截图又有Python图表？
如何让结果更聚焦、更专业、更符合你的写作风格？

全程无需改一行代码，所有操作都在浏览器里完成。现在，我们开始。

2. 镜像启动与服务状态确认：确保两个核心引擎都在运转

DeerFlow 的能力来自两套并行的服务：一个是底层的大语言模型推理服务（vLLM），负责理解、规划和生成；另一个是 DeerFlow 主程序服务，负责协调智能体、调度工具、渲染界面。两者必须同时正常运行，系统才能工作。

2.1 检查大模型推理服务是否就绪

DeerFlow 内置了已部署好的 Qwen3-4B-Instruct-2507 模型服务，运行在 vLLM 框架上。这是整个系统的“大脑”，所有思考、决策、写作都依赖它。

打开终端，执行以下命令查看日志：

cat /root/workspace/llm.log

如果服务启动成功，你会看到类似这样的输出（关键信息是INFO级别日志中出现Started server process和端口监听信息）：

INFO 01-26 14:22:33 [server.py:298] Started server process (pid=123) INFO 01-26 14:22:33 [engine.py:156] Started engine core (pid=124) INFO 01-26 14:22:34 [http_server.py:120] HTTP server started on http://0.0.0.0:8000

成功标志：看到HTTP server started on http://0.0.0.0:8000，说明模型服务已在 8000 端口就绪，等待被调用。

常见问题：如果日志末尾是报错（如OSError: [Errno 98] Address already in use），说明端口被占，可重启镜像或联系支持。

2.2 检查 DeerFlow 主服务是否激活

主服务是“指挥中心”，它读取你的提问，拆解任务，分派给研究员、编码员等角色，并把最终结果组装成报告。

执行命令：

cat /root/workspace/bootstrap.log

成功启动的日志会包含明确的初始化完成信息：

INFO: Application startup complete. INFO: Uvicorn running on http://0.0.0.0:8001 (Press CTRL+C to quit) INFO: DeerFlow coordinator initialized with Tavily search and Python REPL

成功标志：看到Application startup complete.和DeerFlow coordinator initialized...，且监听端口为8001。

注意：两个服务监听不同端口（模型服务 8000，DeerFlow 8001），这是设计使然，不是错误。

3. 前端界面操作全流程：三步完成一次深度研究

服务就绪后，就可以通过 Web UI 开始使用了。整个流程极简，但每一步背后都有复杂的智能体协作。

3.1 进入 Web UI 并启动交互

在镜像控制台界面，点击WebUI按钮（通常位于右上角或侧边栏）。这会自动打开一个新的浏览器标签页，地址类似https://your-instance-id.csdn.net:8001。

页面加载完成后，你会看到一个简洁的对话式界面，顶部有项目名称 “DeerFlow”，中央是聊天窗口，底部是输入框。

3.2 触发深度研究模式

DeerFlow 默认是“轻量问答”模式，类似普通聊天机器人。要启用真正的研究报告生成功能，你需要主动触发“深度研究”。

点击输入框左侧的“Start Research”按钮（一个带有放大镜图标的蓝色按钮）。这个动作至关重要——它告诉系统：“请不要只回答一句话，我要一份完整的、有依据的、可交付的研究报告。”

为什么这一步不能省？
因为深度研究涉及大量资源消耗：多次网络请求、可能的代码执行、长文本生成。系统默认保持轻量，避免误触发。点击按钮，既是用户授权，也是任务启动信号。

3.3 输入研究主题并等待交付

在输入框中，用自然语言描述你的研究需求。越具体，结果越精准。例如：

模糊：“AI Agent”
清晰：“对比分析 LangGraph、AutoGen 和 DeerFlow 这三个开源 AI Agent 框架，在多智能体协作、工具调用灵活性、中文支持和部署复杂度四个维度上的优劣，并附上各自 GitHub 最近三个月的 star 增长趋势图”

按下回车，系统开始工作。你会看到界面上依次出现不同角色的“发言”：

Planner（规划者）：先告诉你它打算怎么做。“我将分三步进行：1. 搜索各框架的官方文档和最新评测；2. 从 GitHub API 获取 star 数据并绘图；3. 综合信息生成对比报告。”
Researcher（研究员）：显示它正在调用 Tavily 搜索引擎，返回多个高相关性网页链接，并摘要关键内容。
Coder（编码员）：展示它生成了一段 Python 代码，用于调用 GitHub REST API 获取 star 数，并用 matplotlib 绘制折线图。代码会自动执行，结果以图表形式嵌入。
Reporter（报告员）：最后，它将所有信息整合，生成一份带标题、章节、数据图表、参考文献的 Markdown 格式报告。

整个过程通常在 2–5 分钟内完成，取决于网络和任务复杂度。

4. 理解背后的智能体协作：它不是在“猜”，而是在“执行”

很多用户第一次看到 DeerFlow 生成报告，会惊讶于它的条理性。这不是大模型“编”出来的，而是由一套精密的多智能体系统分工协作的结果。理解这一点，能帮你更好地引导它产出想要的结果。

4.1 四个核心角色如何各司其职

角色	职责	你如何感知它在工作	关键能力
Planner（规划者）	接收你的原始问题，拆解为可执行的子任务序列，并决定每个任务由谁来完成	界面首条回复，会明确列出“我将分X步进行…”	任务分解、优先级判断、工具选择
Researcher（研究员）	执行网络搜索，筛选权威信源，提取关键事实和数据	显示搜索关键词、返回的网页标题和摘要	多搜索引擎集成（Tavily/Brave）、信息甄别
Coder（编码员）	编写并执行 Python 代码，处理数据、调用 API、生成图表	展示生成的代码块，并立即输出执行结果（如表格、图表）	安全沙箱环境、Python 3.12+ 支持、matplotlib/seaborn
Reporter（报告员）	汇总所有信息，按逻辑组织，撰写专业报告，添加引用和格式	最终交付的是一份结构完整、带图表、有参考文献的文档	报告模板、引用管理、风格一致性

它们不是独立工作，而是通过 LangGraph 构建的状态机实时通信。比如，Coder 生成的图表数据，会自动作为 Reporter 的输入；Researcher 找到的一篇论文结论，会被 Planner 引用到下一步的搜索策略中。

4.2 为什么它有时会“卡住”？——看懂状态流转

如果你发现某次研究长时间停留在某个角色（比如一直显示“Researcher 正在搜索…”），可以观察日志或界面提示。常见原因有：

网络超时：研究员调用的搜索引擎暂时无响应。系统会自动重试，或降级使用备用搜索引擎。
代码执行失败：Coder 生成的代码有语法错误或 API 调用失败。它会分析错误信息，修正代码后重试。
信息不足：Planner 发现当前步骤无法推进（如搜索结果全部无关），会主动返回给 Planner，要求重新规划。

这种“失败-反思-重试”的机制，正是它区别于普通 LLM 的关键——它具备了可观察、可调试、可恢复的工程化行为。

5. 提升报告质量的实用技巧：从“能用”到“好用”

DeerFlow 的默认表现已经很强大，但通过几个简单设置，你可以让它更贴合你的专业需求。

5.1 用“指令前置”明确报告风格与范围

在提问开头，加入一句清晰的指令，能极大提升结果质量。例如：

请以一位资深AI架构师的身份，为技术决策团队撰写一份报告。要求：1. 仅对比框架的核心架构差异，不讨论安装教程；2. 所有数据必须标注来源链接；3. 结论部分需给出明确的选型建议。

这样，Planner 在第一步就会把“架构师视角”、“决策团队”、“明确选型”作为硬性约束，后续所有角色都会围绕此展开。

5.2 利用“追问”进行深度迭代

生成的初稿不是终点。你可以像和同事讨论一样，对报告中的任意部分发起追问：

“第二章提到 LangGraph 的状态机更灵活，请用一个具体代码片段说明它如何比 AutoGen 更易扩展？”
“图表里的 star 增长数据，能补充一下各框架在 Hugging Face 上的模型下载量对比吗？”

系统会识别这是对已有报告的深化，直接调用 Coder 或 Researcher 补充相应信息，而不是从头开始。

5.3 导出与再利用：让报告真正进入你的工作流

生成的报告默认以 Markdown 格式呈现，这意味着你可以：

直接复制粘贴到 Notion、语雀等知识库；
用 Typora 等编辑器导出为 PDF，作为正式交付物；
将其中的 Python 代码块单独保存，用于后续自动化；
将报告中的参考文献列表，一键导入 Zotero 管理。

它不是一个封闭的“黑盒输出”，而是一个可编辑、可复用、可嵌入你现有工作流的活文档。

6. 总结：你获得的不仅是一个工具，而是一个可成长的研究伙伴

回顾整个过程，你没有配置任何 API Key，没有编写一行部署脚本，没有调试环境依赖。你只是：

确认了两个服务在后台安静运行；
点击了一个按钮，启动了深度研究；
用自然语言描述了需求；
等待几分钟，收获了一份专业级报告。

这背后，是 LangStack 框架对多智能体协作的优雅抽象，是 DeerFlow 对研究工作流的深刻理解，更是开源社区将前沿 AI 工程能力平民化的切实努力。

它不会取代你的思考，但会把你从信息洪流中解放出来，让你把精力聚焦在真正的价值点上：提出关键问题、判断信息真伪、做出战略决策。

下一次，当你面对一个陌生的技术领域、一个复杂的市场问题、一个需要多方验证的假设时，不妨试试对 DeerFlow 说：“请帮我深度研究一下……”。然后，坐下来，喝杯咖啡，看它为你构建认知。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

手把手教你用DeerFlow：从零开始打造智能研究报告生成系统