智谱发布GLM-5.2：100万token无损上下文，长程Coding能力达开源SOTA

6/26/2026

6月13日，智谱AI正式发布新一代旗舰开源大模型GLM-5.2。这是智谱在4个月内完成的第三次重大迭代，核心亮点聚焦于超长上下文处理与长程编程Agent能力两大方向，多项指标达到开源社区SOTA水平。

核心升级：100万token无损上下文

GLM-5.2最重磅的升级是支持100万token的无损上下文窗口。在实际的长程任务中，模型能够显著减少"上下文漂移"和"目标遗忘"两大顽疾——这是此前大模型在处理复杂多步任务时最容易翻车的地方。对于需要持续跟踪大型代码库、长文档分析、多轮复杂推理的场景，这一升级带来的稳定性提升是质变级的。

长程Coding Agent专项强化

智谱透露，团队针对长程Coding Agent场景进行了数月的专项强化训练，覆盖大规模代码实现、自动化研究、性能优化、复杂调试等高价值任务。在权威的Coding与长程任务评测中，GLM-5.2已达到开源SOTA，在复杂系统工程和深度调试场景下表现尤为稳定。

架构与参数

GLM-5.2延续MoE（稀疏混合专家）架构与动态稀疏注意力（DSA）技术路线，总参数量744B，激活参数约40B，训练数据截止至2025年11月。当前版本专注于纯文本与代码处理。

灵活的推理投入度控制

新引入的多档推理投入度控制是一大亮点，用户可在模型能力与任务执行速度、计算成本之间自由权衡。在相同token消耗下，GLM-5.2的Agent编程性能远强于前代GLM模型。

开源与可用性

GLM-5.2采用MIT协议开源，面向GLM Coding Plan全量用户（Lite/Pro/Max/团队版）开放，API于发布次周上线。这意味着开发者和企业可以零成本地将这一顶级模型集成到自己的产品中。

行业影响

GLM-5.2的发布进一步加剧了开源大模型领域的竞争。100万token上下文+开源SOTA的Coding能力，使其成为Claude Code、Cursor等编程工具底层模型的有力竞争者。对于关注AI编程效率的开发者而言，这是一个值得密切关注的重大更新。

想了解GLM-5.2与其他主流编程模型的详细对比，请访问我们的AI工具深度对比中心。