Open Notebook:自己部署一个比 NotebookLM 更猛的 AI 研报工作台
最近翻 GitHub Trending 看到一个项目冲到第一名:lfnovo/open-notebook,一天涨了 794 颗星,标语写着「A private, multi-model, 100% local, full-featured alternative to Notebook LM」。作为一个常年被 NotebookLM 圈粉、又被它锁死在 Google 云里难受的人,我立刻拉下来玩了一圈。
先说结论:这玩意儿是我今年用过的最舒服的研究类工具,没有之一。
它解决的是什么问题
NotebookLM 是个好产品。我拿它读过论文、啃过技术报告、生成过播客,但有三个点一直让我抓狂:
- 数据必须交给 Google。上传的 PDF、笔记、播客脚本都在 Google 的云上,敏感资料不敢传。
- 只能用 Google 的模型。Gemini 强是强,但我想用 Claude、想用本地 Ollama、想跑 Qwen,统统不行。
- 没有 API。想把它接到自己的 workflow 里自动化?没门。
Open Notebook 就是冲着这三点来的:
- 100% 自托管,Docker Compose 拉起来就跑
- 18+ 模型供应商,OpenAI、Anthropic、Google、Ollama、DeepSeek、Mistral、Qwen 全支持,甚至可以走 OpenRouter
- 完整 REST API,什么都能自动化
对我来说,这就把”AI 研报” 这件事从”Google 给我什么我用什么” 变成了” 我想怎么用就怎么用”。
核心能力拆解
1. 资料摄取:什么都能往里塞
支持 PDF、视频、音频、网页链接、Office 文档、Markdown,纯文本直接复制也行。
我自己的用法是建一个 daily-research 笔记本,把每天想看的论文、行业报告、播客转写都丢进去。后台会自动抽取文本、切块、向量化。
2. 多模型 Chat:带着上下文问问题
每个笔记本可以单独配置默认模型。我习惯这么配:
- 日常问答用
claude-sonnet-4.5(性价比好) - 重要决策用
claude-opus-4.5(深度推理) - 涉密内容用本地
qwen2.5:32b(数据不出本机)
切换的时候不用动代码,直接在 UI 里改。
3. Transformations:可编程的” 研报流水线”
这是我最喜欢的部分。Transformation 是一组可复用的处理步骤,你可以理解为” 研报工作流的乐高积木”。
内置的就够用:摘要、要点提取、FAQ 生成、人物关系抽取…… 我经常用的是「先抽要点,再生成 FAQ,再翻译成中文」三件套。
进阶玩家可以自己写 prompt 模板,支持 Jinja 语法,能引用当前笔记本的内容。
4. 播客生成:1-4 个 Speaker,比 NotebookLM 灵活
这个功能必须单独拿出来说。
NotebookLM 的 Audio Overview 只能生成两个主持人、只有一种风格。Open Notebook 直接把天花板抬到 4 个 speaker,而且每个 speaker 可以配:
- Expertise:这个人的专业背景,比如「对齐研究专家」
- Personality:性格,Rigrous、Skeptical、Warm、Sarcastic 都行
- Accent:可选口音(British English、Southern US 等)
- Voice Model:从模型注册表里挑 TTS,OpenAI、Google、ElevenLabs、本地 TTS 都行
Episode Profile 还可以定义格式:debate(辩论)、interview(采访)、monologue(独白)、educational(教学)。
我试了一个:让”AI 安全派专家” 和”AI 加速派投资人” 对一组论文做 debate,生成 20 分钟播客。听起来就像两个人真的在吵,还挺有意思。
生成是异步的,一集 20 分钟的播客大概要跑 10-15 分钟。后台跑就行,跑完会有通知。
5. 完整 REST API:把它接到任何地方
这是和 NotebookLM 的最大区别。Open Notebook 暴露了完整的 FastAPI,可以做:
1 | # 创建一个笔记本 |
我的用法是每天早上跑一个 cron,用它把 RSS 抓回来的文章自动入库、自动摘要、自动塞进 Obsidian。比之前手动操作省了 20 分钟。
十分钟跑起来
Docker Compose 是官方推荐的方式:
1 | git clone https://github.com/lfnovo/open-notebook.git |
等 15-20 秒,浏览器开 http://localhost:8502,第一次进 UI 去 Settings 配 API key。我配的是 Anthropic 和 OpenAI,播客用的 TTS 选了 OpenAI(速度快、便宜)。
完全本地、不想连外网的,可以用 examples/docker-compose-ollama.yml 那个配置,跑 Ollama + 本地嵌入模型,全离线。
我自己的几个使用场景
我的工作流是「读得多、写得少、决策快」,Open Notebook 完美对上:
场景一:行业研究晨会
每天早上 7 点跑一个 cron,把 Hacker News、TechCrunch、arXiv 的当日 top 抓下来,丢进 morning-briefing 笔记本,跑一遍「要点提取 + 中文摘要 + 风险提示」三个 transformation,10 点之前看完,决定今天重点关注什么。
场景二:客户资料的本地化分析
做咨询的时候经常要处理客户的内部资料(合同、调研报告、技术文档)。这种数据绝对不能传 Google。Open Notebook + 本地 Ollama 跑通之后,整套研报流程都在我自己的 MacBook 上完成,客户的数据从未离开过本机。
场景三:把读过的论文做成播客
跑步和通勤是我一天里仅有的” 被动学习” 时间。Open Notebook 让我把平时读不进去的长论文丢进去,让两个 AI 主持人给我辩论一遍,听着听着就把要点抓住了。
它和 NotebookLM 怎么选
写个直白的对比:
| 场景 | 推荐 |
|---|---|
| 临时玩玩、不在乎数据出境 | NotebookLM |
| 个人使用、追求省事、模型用 Gemini 就够 | NotebookLM |
| 团队协作、需要把研报接进工作流 | Open Notebook |
| 数据敏感、必须本地化 | Open Notebook |
| 想用 Claude / 本地模型 / 多模型混搭 | Open Notebook |
| 想要 API 做自动化 | Open Notebook |
| 想要 3-4 人播客、辩论格式 | Open Notebook |
说白了,NotebookLM 是给” 消费者” 的工具,Open Notebook 是给” 构建者” 的工具。两者不冲突。
几个小坑提醒
我自己踩过的,列出来省你时间:
- SurrealDB 第一次启动慢。别看到日志没动就急着
docker compose restart,等 1-2 分钟。 - 本地 Ollama 模型要够大。低于 14B 的模型做 transformation 容易抽风,建议 32B 起步。
- TTS 选 Google 最划算。OpenAI 0.015 美元 / 分钟,Google 才 0.004,差距 4 倍。ElevenLabs 音质最好但贵(土豪随意)。
- 加密密钥一定要改。默认那个
my-super-secret-key-123是 demo 值,不改等于没加密。
收个尾
NotebookLM 让我意识到「AI 研报」是未来,但 Open Notebook 让我意识到「自己的 AI 研报」才是未来。
数据主权、模型选择权、API 可编程性,这三件事 Google 给不了,开源给得了。26k 的 star 还在涨,社区活跃,作者 lfnovo 在 Discord 上响应很快,遇到问题去问基本当天就有答案。
如果你也在找一个” 可以本地化、可编程、可换模型” 的研究工作台,从今天开始用 Open Notebook 吧。