Poe对决Perplexity:哪款AI研究工具胜出?

Poe vs Perplexity:哪款AI研究工具胜出?

过去三个月,我一直在测试Poe和Perplexity,从快速事实核查到深度研究报告,无所不用。这是我最真实的感受。

快速对比表

特性 Poe Perplexity
月费 $19.99 (Pro) $20 (Pro)
免费版 有(受限) 有(受限)
可用模型 GPT-4、Claude-3、Gemini、Llama 3、Mistral等50+ GPT-4、Claude-3、Perplexity自研模型
上下文窗口 最高20万token(Claude-3) 最高10万token
实时网络搜索 有限(通过特定机器人) 内置,始终开启
引用来源 有,内联来源
文件上传 支持(PDF、图片、文本) 支持(PDF、图片、CSV)
语音输入 支持(移动端) 支持(移动端)
API访问 有(月费$5起)
每日最大消息数(免费) 约100条(因模型而异) 5次专业查询,无限基础查询

概述

Poe本质上是一个多模型聊天平台。由Quora创建,它让你用一个订阅就能访问几十个AI模型。你可以在GPT-4、Claude-3、Gemini、Llama 3、Mistral等之间即时切换。就像一个AI对话的瑞士军刀。

Perplexity则是一个以研究为先的搜索引擎。它将大语言模型与实时网络搜索结合,提供带引用的答案。可以把它想象成Google与ChatGPT的结合体,但更注重准确性和来源透明。

逐项功能对比

1. 研究质量

我对两个工具提出了同样的问题:“2024年CRISPR基因编辑有哪些最新突破?”

Perplexity返回了详细答案,包含7条来自《自然》《科学》和同行评审期刊的内联引用。每条引用都可点击,我可以展开来源面板查看完整上下文。答案非常及时,引用了两周前的研究。

Poe也给出了不错的总结,但没有任何来源。我必须手动要求它引用,即便如此,它还是编造了两个虚假网址。这是许多原始LLM的已知问题——它们会幻觉出来源。

胜者:Perplexity

2. 模型多样性

Poe在这方面大放异彩。我可以用Claude-3 Opus进行创意写作,切换到GPT-4编写代码,再用Llama 3快速头脑风暴——全部在同一个应用内完成。模型选择器干净且响应迅速。

Perplexity只提供少数模型:自研模型加上GPT-4和Claude-3。但对于研究来说,这已经足够。当你的核心任务是找到准确信息时,不需要50个模型。

胜者:Poe

3. 实时信息

Perplexity的搜索始终开启。当我问“红海现在发生了什么?”,它从路透社、BBC和半岛电视台拉取了实时新闻,并带有时间戳。“聚焦”功能让你可以专门搜索学术论文、YouTube、Reddit或新闻。

Poe也能进行网络搜索,但只能通过特定的机器人(如WebSearch)或启用GPT-4的浏览功能。使用起来更笨重、更慢。搜索结果常常像是事后添加的功能。

胜者:Perplexity

4. 文件分析

两个工具处理PDF都不错。我向两者上传了一份关于量子计算的50页研究论文。Poe(使用Claude-3)给出了一个出色而细腻的总结,捕捉到了作者对近期量子优势的怀疑态度。Perplexity的总结更有条理,将论文分成章节并列出关键要点,但洞察力稍逊。

在多文件工作流程上Perplexity胜出。我可以上传三个PDF,要求它比较不同文件中的发现。Poe需要我切换聊天或手动提供上下文。

胜者:平局

5. 用户界面

Poe的界面精致有趣。移动应用尤其出色——流畅的动画、快速的模型切换、干净的聊天历史。桌面网页版同样扎实。

Perplexity的界面更实用。它工作得很好,但感觉更像一个生产力工具,而不是聊天应用。左侧的合集(线程)边栏对于组织研究项目很有用。

胜者:Poe

6. 定价与价值

两者Pro版月费都在20美元左右。Poe让你访问几乎所有主要模型,如果你想尝试各种模型,这非常棒。但对于纯粹的研究,Perplexity的Pro计划提供无限的专业查询、文件上传和API访问——对研究人员来说价值更高。

Perplexity的免费版对研究也更慷慨:每4小时5次专业查询,加上无限的基础搜索。Poe的免费版很快会用完高质量模型的访问权限。

胜者:Perplexity

优缺点

Poe优点

  • 一个订阅包含海量模型选择
  • 非常适合创意任务和角色扮演
  • 出色的移动体验
  • 定期添加新模型
  • 社区创建的特定功能机器人

Poe缺点

  • 没有内置引用或来源透明
  • 网络搜索是次要功能
  • 免费版对顶级模型限制很大
  • 生成来源时存在幻觉问题
  • 开发者无API访问

Perplexity优点

  • 始终开启的实时网络搜索,带引用
  • 事实查询高度准确
  • 非常适合学术和专业研究
  • 多种搜索模式(学术、视频、新闻、社交)
  • 提供API用于集成
  • 强大的来源验证功能

Perplexity缺点

  • 模型种类有限(仅3个主要模型)
  • 不如Poe有创意和有趣
  • 移动端界面不够精致
  • 专业查询有次数限制(免费版每4小时5次)
  • 不适合开放的创意写作

最终裁决

Perplexity是研究类别的胜者。

我每天使用这两个工具已经几个月了,最诚实的结论是:如果你的主要目标是找到准确、最新的信息并带有可验证的来源,Perplexity显然更好。内置搜索、内联引用和对事实准确性的专注使其在研究任务中不可或缺。

Poe在其他方面很棒——创意写作、编程实验、探索不同的AI个性。但对于研究,它因为缺乏来源透明度和网络搜索的附加感而逊色。

我当前的工作流程:所有研究和事实核查用Perplexity,然后切换到Poe进行创意头脑风暴或测试新模型。两者各有其位,但在研究类别中,Perplexity摘得桂冠。

如果你是学生、记者或需要确保事实准确的专业人士,选择Perplexity。如果你是想要尝试所有模型的AI爱好者,选择Poe。对于大多数做研究的人来说,Perplexity是更好的投资。