我花了一个月测试Claude、Grok和DeepSeek——这里说说实际体验

过去一年我几乎每天都在使用AI工具——写代码、起草内容、分析数据，总之就是想提高工作效率。当Claude、Grok和DeepSeek都开始引起关注时，我觉得是时候对它们进行实际测试了。我花了整整一个月，用它们处理真实任务，而不是简单的示例。以下是我的发现。

快速对比表

特性	Claude (Sonnet 4)	Grok (xAI)	DeepSeek (V3)
价格	每月20美元Pro版，免费版有限制	每月16美元X Premium+，免费版	免费（有限制），每月10美元Pro版
上下文窗口	10万token	12.8万token	12.8万token
代码生成	优秀	良好	非常好
创意写作	杰出	一般	良好
推理能力	强	尚可	非常强
速度	快	中等	非常快
联网能力	有限（通过工具）	原生（X集成）	无
文件上传	图片、PDF、文本	图片、文本	图片、文本
最适合	深度分析、写作、编程	实时信息、社交媒体	数学、逻辑、高性价比编程

Claude（我使用的是付费版的Sonnet 4）给人的感觉就像与一位读过所有书籍、非常聪明的同事共事。界面简洁，几乎极简主义。没有花哨的图形，没有个性噱头。只有一个文本框和一个思考图标。

最让我印象深刻的是Claude处理长对话的方式。我扔给它一份50页的PDF——一篇关于量子纠错的技术白皮书——要求它总结。Claude不仅给出了清晰的概述，而且两天后当我询问特定部分的后续问题时，它还记得上下文。那10万token的窗口不仅仅是规格表上的数字，它在实际中确实有效。

Grok……与众不同。它内置于X（Twitter）中，因此具有实时、略带不敬的个性。我注意到的第一件事是“趣味模式”切换开关。你可以在“常规”和“趣味”回复之间切换。在趣味模式下，Grok会开玩笑、讽刺，有时还会稍微冒犯你。如果你厌倦了过于礼貌的AI助手，这会让人耳目一新。

但关键是——Grok的真正优势在于它能访问X的海量数据流。当我询问科技新闻趋势时，Grok能告诉我当下正在发生的事情，而不仅仅是训练数据中的内容。这对于“今天股市怎么样？”或“有新iPhone泄露吗？”这类问题非常实用。

说实话，我对DeepSeek期望不高。它是一个中国AI模型，我以为它会是个廉价的仿制品。我错了。

DeepSeek V3速度很快。比Claude或Grok明显更快。当我让它写一个Python脚本……