智谱GLM-5.1发布：国产开源模型新突破，8小时持续工作能力领跑全球-网界

智谱今日宣布推出新一代开源模型 GLM-5.1，官方宣称该模型在多项关键指标上达到全球领先水平，成为目前开源领域性能最强的智能体。据技术团队介绍，GLM-5.1 突破了传统模型的时间限制，首次实现单次任务持续运行超8小时，期间可自主完成规划、执行与优化，最终交付符合工程标准的完整成果。

在专业软件开发能力验证方面，GLM-5.1 在 SWE-bench Pro 基准测试中刷新全球纪录，超越 GPT-5.4 和 Claude Opus 4.6 等闭源模型。该测试要求模型在真实 GitHub 仓库中定位并修复高难度工程级 Bug，被业界视为衡量模型实用性的核心标准。技术文档显示，GLM-5.1 在处理复杂代码库时的准确率较前代提升37%，尤其在需要跨文件协作的场景中表现突出。

代码生成能力是此次升级的重点方向。根据 Terminal-Bench 2.0 和 NL2Repo 等权威评测数据，GLM-5.1 在命令行操作和完整代码仓库构建任务中取得全球第三、国产模型第一的成绩。技术团队透露，通过引入动态注意力机制和长程记忆模块，模型在处理超长上下文时的信息保留率提升至92%，较分钟级交互模型有质的飞跃。

伴随模型发布，智谱同步调整了商业服务价格体系。OpenRouter 平台数据显示，GLM-5.1 在 Coding 场景的缓存命中 Token 价格上调10%，调价后与 Anthropic 旗下 Claude Sonnet4.6 的定价持平。这是国产大模型首次在核心应用场景实现与海外头部产品的价格对齐，标志着中国AI技术在商业化层面取得重要突破。

技术白皮书指出，GLM-5.1 的突破性进展源于三大创新：一是引入自适应任务分割算法，使模型能动态调整工作节奏；二是构建多层级验证系统，确保长时间运行中的结果可靠性；三是开发专用代码优化器，可自动重构低效代码片段。这些特性使其在智能体工程、自动化运维等长周期任务中展现出独特优势。