先问你一个问题:你用过 Google NotebookLM 吗?
如果用过,你大概知道那种感觉——把一堆 PDF、网页链接丢进去,AI 帮你梳理脉络、生成播客对话,有时候真有点魔法的感觉。
但你有没有想过,那份竞品调研报告、那篇还没发表的论文草稿、那堆精心整理的行业资料……全都悄悄躺在谷歌的服务器上了?
谷歌怎么用这些数据?会不会用来训练模型?我不知道,你也不知道。
这就是Open Notebook存在的理由。
26K Star 的 NotebookLM 平替
Open Notebook 是 NotebookLM 的完全开源平替,GitHub 目前26.6K Star,MIT 协议,官网在 open-notebook.ai。
一句话定位:自托管、隐私优先、支持 18+ AI 提供商的 AI 研究助手。
不是"差不多能用"的平替,而是在某些功能上真的比 NotebookLM 更强的那种。
技术栈是 Python + FastAPI + Next.js + React + SurrealDB + LangChain。支持多语言界面,中文简繁体都有。
数据主权不是口号
"数据主权"这词听起来很宏大,但落地很具体。
你有没有遇到过这些情况:
公司内部的竞品分析,想用 AI 帮忙整理,但不敢传到云端
还没发表的研究成果,不确定传给第三方服务是否合适
客户合同、内部会议纪要,想让 AI 提炼要点,但规定不允许上传外部服务
Open Notebook 的方案是:全部跑在你自己的机器或服务器上,数据不离本地。
搭配 Ollama,连 AI 模型都不用联网——真正做到 100% 本地运行。
核心设计:三层知识架构
Open Notebook 有一个设计得相当清晰的数据模型,理解它是用好这个工具的关键。
┌─────────────────────────────────────┐ │ NOTEBOOK(笔记本) │ │"我的 AI 安全研究 2026"│ ├─────────────────────────────────────┤ │ │ │ SOURCES(原始来源) │ │ ├─ safety_paper.pdf │ │ ├─ alignment_video.mp4 │ │ └─ prompt_injection_article.html │ │ │ │ NOTES(处理后的洞察) │ │ ├─ AI 生成摘要 │ │ ├─ 关键概念提取(变换操作) │ │ ├─ 我自己写的研究笔记 │ │ └─ 对话中保存的洞察 │ └─────────────────────────────────────┘三层,逻辑清晰:
Notebook(笔记本)是项目容器,彼此完全隔离。竞品调研和个人学习笔记不会混在一起,可以同时开 10 个项目互不干扰。
Sources(来源)是原始素材。一旦添加就不再变动,系统自动建立全文索引和向量索引。支持 PDF、视频、音频、网页、Office 文档,基本上你能想到的格式都能处理。
Notes(笔记)是处理后的产出——AI 生成的摘要、你自己写的笔记、从对话中保存的洞察。这才是知识沉淀的地方,带引用来源,可以追溯每个结论从哪来的。
这个设计有点 Zettelkasten 的味道:素材永久保留,洞察不断积累。
和 NotebookLM 到底差在哪?
直接上对比表:
特性 | Open Notebook | NotebookLM |
|---|---|---|
| 数据隐私 | 完全自托管 | 谷歌云端 |
| AI 模型 | 18+ 提供商自由选 | 仅谷歌模型 |
| 播客说话者 | 1–4 个,可定制声音 | 固定 2 个 |
| API 访问 | 完整 REST API | 无 |
| 部署方式 | Docker / 云 / 本地 | 仅谷歌托管 |
| 费用 | 仅付 AI 调用费 | 免费 + 月订阅 |
| 可定制性 | 完全开源可修改 | 封闭系统 |
播客功能特别值得说一下。NotebookLM 的播客是它的明星特性,两个固定主播,效果确实不错。但 Open Notebook 支持1–4 个说话者,每个可以自定义声音配置,还支持 ElevenLabs 和 Google TTS 引擎。灵活程度差了不是一点点。
18+ AI 提供商,随便选
这个支持列表我看了一遍,主流的都覆盖了:
提供商 | LLM | 向量嵌入 | 语音转文字 | 文字转语音 |
|---|---|---|---|---|
OpenAI | ✅ | ✅ | ✅ | ✅ |
Anthropic (Claude) | ✅ | ❌ | ❌ | ❌ |
Google (Gemini) | ✅ | ✅ | ✅ | ✅ |
Ollama(本地免费) | ✅ | ✅ | ❌ | ❌ |
Groq(有免费额度) | ✅ | ❌ | ✅ | ❌ |
DeepSeek(R1 推理) | ✅ | ❌ | ❌ | ❌ |
DashScope (Qwen3) | ✅ | ❌ | ❌ | ❌ |
ElevenLabs | ❌ | ❌ | ✅ | ✅ |
Azure OpenAI | ✅ | ✅ | ✅ | ✅ |
Mistral / xAI / OpenRouter… | ✅ | 部分 | 部分 | 部分 |
底层靠作者自研的 Esperanto 库做统一抽象。
值得注意的是:DeepSeek-R1 和 Qwen3 这类推理模型也支持,可以在需要深度思考的任务上用上这些"慢但准"的模型。
想省钱的策略:日常对话用 Groq 的 Llama(有免费额度,速度极快),嵌入用 Ollama,播客 TTS 用 Google,整体成本能压很低。
5 分钟把它跑起来
前置条件只有一个:装好Docker Desktop。
# 第一步:下载配置文件curl -o docker-compose.yml \ https://raw.githubusercontent.com/lfnovo/open-notebook/main/docker-compose.yml# 第二步:编辑文件,把这行改成自己的密钥# OPEN_NOTEBOOK_ENCRYPTION_KEY=change-me-to-a-secret-string# 第三步:启动docker compose up -d等 15–20 秒,打开http://localhost:8502。
进去之后:Settings → API Keys → Add Credential → 填入你的 API Key → Discover Models → Register Models,就能开始用了。
想完全本地,连 API 费用都省掉?换一个包含 Ollama 的配置文件:
curl -o docker-compose.yml \ https://raw.githubusercontent.com/lfnovo/open-notebook/main/examples/docker-compose-ollama.yml docker compose up -d这样连 AI 调用费都没有,完全零成本运行。
几个用起来会喜欢的设计细节
上下文精细控制
每个来源可以独立设置三个档位:不进上下文 / 仅摘要 / 完整内容。你不用把所有资料都砸给 AI,可以精确控制每次对话用哪些信息——对 token 消耗控制友好,对隐私控制也友好。
Chat vs Ask 两种模式
Chat:你手动选哪些资料进上下文,然后自由对话。适合深度探索,你控制全局。
Ask:输入问题,系统自动用 RAG 检索相关片段再回答。适合快速查找,适合资料多的大笔记本。
两种模式面向不同场景,设计很务实,不是为了堆功能而堆。
Transformations(内容变换)
对单份资料做结构化提取:主要观点、关键概念、方法论、行动要点……有内置模板,也可以自定义。比让 AI "帮我总结一下"要精准得多,输出结果是真正可以复用的知识片段。
MCP 集成
Open Notebook 支持 MCP(Model Context Protocol),可以直接接入 Claude Desktop 或 VS Code。研究数据沉淀在 Open Notebook,AI 对话在 Claude Desktop,两者通过 MCP 打通——这个组合很香。
说说我的保留意见
引用功能目前还比较基础,和 NotebookLM 的精准引用有差距。你问它"这个结论在哪篇文章里?",它能给出来源,但精确到具体段落的能力还需要打磨。作者在 roadmap 里也承认了这个问题,说会持续改进。
另外,部署本身对普通用户还是有点门槛——虽然有 Docker 一键启动,但配置 AI 提供商、理解三层架构、调试环境变量,对不懂技术的用户还是需要一定学习成本。作者甚至专门做了一个 CustomGPT 安装助手 来帮助用户上手,可见这个问题他们也意识到了。
适合谁用?
强烈推荐:
有数据隐私顾虑的研究者和从业者
想控制 AI 成本、可以自己选模型的用户
想深度定制、有开发能力的工程师
NotebookLM 重度用户,想要更强的播客功能和 API 能力
可以继续用 NotebookLM:
只是轻量使用,不在意数据隐私
不想折腾任何部署,要开箱即用
高度依赖 NotebookLM 的精准引用功能
最后
在一个越来越多工具要求你"把数据交给我"的时代,Open Notebook 选择了反其道而行:你的数据,你说了算。
26.6K Star 不是噱头,MIT 协议不是限制——这是真正意义上你可以 fork、可以魔改、可以永久自托管的工具。
感兴趣的话,GitHub 地址:https://github.com/lfnovo/open-notebook
你现在用什么工具管理研究资料?用过 NotebookLM 或类似的 AI 知识库工具吗?欢迎评论区聊聊你的工作流,顺便说说有没有什么数据隐私上的顾虑。
我是顾北,关注我,获取更多好玩有趣的开源仓库!
谢谢你阅读我的文章~
我们下期再见!
PS:本文部分内容由AI辅助创作