快速概览
在过去的六个月里,我几乎每天都在使用 NotebookLM 和 ChatGPT,老实说,它们感觉像是完全不同的工具,只是恰好都带有“AI”这个词。NotebookLM 是谷歌针对深度研究和笔记的解决方案——它的核心理念是将所有内容“扎根”于你自己的文档。你可以上传 PDF、网页链接、YouTube 视频,甚至是 Google 文档,而 AI 只能基于这些材料来回答。相比之下,ChatGPT 是一个通用型助手,它从训练数据中提取信息,或者可以浏览网页。当我需要消化一份 200 页的报告且不希望出现幻觉风险时,我会用 NotebookLM;而当我在头脑风暴或需要快速了解世界上的问题时,我会用 ChatGPT。它们在某些方面有重叠,但核心用途截然不同。
功能对比
| 功能 | NotebookLM | ChatGPT (GPT-4 / GPT-4o) |
|---|---|---|
| 数据来源 | 仅限你上传的文档(PDF、Google 文档、网页链接、YouTube 转录) | 基于截至 2023 年的互联网数据训练(GPT-4)或可实时浏览网页(GPT-4 带浏览功能) |
| 幻觉风险 | 非常低——它只使用你的来源。如果不知道,它会明确说明。 | 中等——如果不知道某些信息,尤其是针对小众话题,可能会编造事实 |
| 上下文窗口 | 每个笔记本最多 20 万 token(我曾上传过 500 页的书籍) | GPT-4 Turbo 为 12.8 万 token,标准 GPT-4 为 3.2 万 token |
| 引用系统 | 自动内联引用,带来源编号。你可以点击跳转到文档中的确切位置。 | 没有内置引用,除非你要求“显示来源”(而且它可能会编造来源) |
| 自定义功能 | 你可以为每个项目创建“笔记本”。每个笔记本有自己的来源集。无法控制系统提示。 | 自定义指令、GPT(自定义机器人)和记忆功能。你可以调整语气、角色和行为。 |
| 多模态输入 | 可处理来自 PDF、网页、YouTube 转录的文本。不支持图像分析。 | 可分析图像、生成图像(通过 DALL·E)和处理音频(语音模式)。 |
| 语音对话 | 仅文本(但可生成音频摘要,称为“音频概览”) | 全语音对话(你说话,它回应),带有自然的停顿和语调 |
| 离线/隐私 | 所有数据保留在你的 Google 账户中。不会根据你的文档进行训练(根据谷歌政策)。 | 数据可用于训练模型,除非你选择退出(在企业版/API 中可控制) |
| 导出选项 | 导出为 Google 文档、PDF 或分享只读链接。 | 导出聊天为文本、分享链接或使用 API。 |
| 网络搜索 | 不支持——它只使用你上传的来源。你不能让它“谷歌搜索一下”。 | 支持,如果你启用浏览功能。它可以实时搜索网络。 |
| 最适合 | 深度研究、学习、法律文档、技术手册、笔记整合 | 创意写作、编程、快速问答、图像生成、角色扮演、客户支持 |
使用 NotebookLM
我第一次爱上 NotebookLM 是在一个杂乱的研究项目中。我有 40 多篇学术论文的 PDF、十几个 YouTube 访谈以及几篇关于气候政策的网络文章。我没有手动整理它们,而是把所有内容都扔进了一个 NotebookLM 笔记本。AI 立即总结了每个来源,突出了关键主题,而且——最棒的功能是——当我问“2022 年 IPCC 报告中反对碳捕获的三个主要论点是什么?”时,它用要点回答,每个要点旁边都有一个数字。我点击一个数字,它直接跳转到 PDF 中的确切段落。这为我节省了几个小时的浏览时间。我用它做过各种事情,从分析软件文档到准备需要记住公司年报的求职面试。
缺点是什么?它的范围非常有限。如果我问“东京现在的天气怎么样?”,它只会表示不知道。它不能浏览网页,不能生成图像,也不能写一首关于我猫的诗,除非我先上传一份关于我猫的文档。界面也非常简陋——只有一个聊天窗口和一个来源面板。笔记本之间没有记忆,所以如果我从“项目 Alpha”切换到“项目 Beta”,它会忘记第一个项目的所有内容。音频概览(AI 生成的播客风格摘要)虽然不错,但往往听起来很机械,而且会遗漏细微之处。我发现它们在长途通勤时有用,但不适合严肃的复习。
另外一点:NotebookLM 在坚持使用来源方面绝对严格。如果我上传的文档包含矛盾,它会指出来。但如果我的来源是错误的,AI 也会出错。我吃了一次亏,上传了一份过时的技术手册,它自信地给了我错误的接线说明。所以你还是需要审查你的来源。它是一个用于综合的工具,而不是事实核查。
使用 ChatGPT
ChatGPT 是我的瑞士军刀。我用它来起草邮件、调试 Python 脚本、头脑风暴
