从一月份开始,我同时在用ChatGLM和Claude做实际工作——不是跑测试题,而是真的写代码、改邮件、总结会议记录,甚至帮我孩子写生日贺卡上的诗。
这是我最真实的感受。
第一印象
ChatGLM打开就能用,不用排队,不用绑信用卡。我输入“帮我写一个Python脚本整理文件夹”,4秒后就给出了可运行的代码。中文表达非常自然,没有那种机翻味。
Claude需要注册邮箱,还问了我的使用场景。第一次回复感觉慢一些,大概8秒。但当我让它解释一个复杂的SQL查询时,它的解释更深入,用了我能理解的类比。
具体任务对比
任务一:总结30页中文PDF
ChatGLM处理得不错,提取了关键点、日期和决策。但它漏掉了第22页的一个细微矛盾——有一条条款和执行摘要冲突了。我是自己扫了一眼才发现的。
Claude立刻抓住了这个矛盾,在摘要里标了出来:“注意:第22条与摘要第3段存在冲突。”这帮我避免了一次合同审查中的潜在失误。
任务二:写英文冷启动邮件
ChatGLM的版本直接且礼貌,但用了“I hope this message finds you well”——2024年这么写有点过时了。
Claude的版本开头提到了收件人最近的一篇博客文章,具体地夸了一句。感觉很真诚,不是模板。我最后真的发了这封。
任务三:调试混乱的Python代码
我贴了一段200行总报错的脚本。ChatGLM 10秒就找到了索引错误。Claude也找到了同样的错误,还额外指出了一处我没注意到的内存泄漏。
小毛病
ChatGLM有时回答过于热情。我让它批评我的简历,它说“完美”,只建议改个字体。没什么用。
Claude偶尔拒绝执行任务。我让它改写一封略带讽刺的邮件,它说“无法协助可能不专业的内容”。我只好重新措辞。
速度 vs 深度
ChatGLM更快。翻译、简单代码、基础摘要这些快速任务,我首选它。像个双倍速工作的得力助手。
Claude慢一些,但更周全。任何需要理解细微差别、发现矛盾或做安全检查的任务,我愿意多等几秒。
最终结论
两个都留着。中文为主、求速度时用ChatGLM。需要深度分析、英文写作、或者漏掉细节会出大事时用Claude。
如果只能选一个:中文工作流选ChatGLM,英文为主的高风险工作选Claude。但说实话——它们互相补充的效果,比我试过的任何一个单一模型都好。