体验完智谱刚刚发布的GLM-5，我终于明白它为什么让硅谷猜破了头

日期：2026-02-13 21:52:11 / 人气：5

而且，它直接开源了。
如果说2025年是AI学会写代码的一年，那么2026年开年，正如特斯拉前AI总监Andrej Karpathy所预言，我们或许即将进入「智能体工程」（Agentic Engineering）时代。
只不过，比起GPT-5.3-Codex、Claude Opus 4.6，头一个把这件事做成开源基础设施的，是国产模型GLM-5。
附体验地址：
Z.ai：https://chat.z.ai
智谱清言APP/网页版：https://chatglm.cn
骗过硅谷的Pony Alpha，竟然是智谱GLM-5的马甲
现在的AI写个贪吃蛇或者俄罗斯方块，早就不是什么新鲜事了。要测，就得测点刁钻的。
我们给GLM-5抛出了一个极其具体的物理模拟需求：
创建一个交互式的HTML、CSS和JavaScript卫星系统模拟程序，该程序应模拟卫星向地面接收器发送信号的过程。模拟程序应显示一颗卫星绕地球运行，并周期性地发送信号，这些信号会被多个地面接收器接收。
它没有立刻给出代码，而是稍微「停顿」了一下（模拟思考过程），最终按照我的需求生成了一个HTML网页。屏幕上，卫星不仅仅在转圈，信号传输甚至带有符合多普勒效应视觉隐喻的波纹扩散动画。
它理解了「模拟」二字背后的物理规律，而不仅仅是理解了「画图」这个动作。
接着，我们加大了难度。
X上有个叫@scaling01的用户，给出了一个极高的评价：「Pony-Alpha要么是AGI，要么就是把我的SVG题目库给背下来了。」
为了验证这一点，我们测试了一个极其抽象的Python任务：「可视化展示单行道中交通信号灯的工作原理，车辆以随机速率进入。」
不到3分钟，一个动态的交通流模拟图出现了。
逻辑可以说是严丝合缝：绿灯放行、红灯排队，车辆加速减速的随机性也模拟得很到位。不过，这个界面的审美……怎么说呢，确实有点「简陋」。
甚至有网友@anurudhsharmaa用它一行提示词生成了一个全新的网站。
而网友@zakarinoo7生成了一个全功能的媒体播放器——支持MP4/MP3解码、播放列表管理，甚至连深色模式的UI都写好了，编译完只有15MB。
这一幕看得我心痒难耐。于是，我也再次通过Claude Code，让GLM-5给我打造打一个火柴人开放世界游戏。
它没有急着写代码，它做了一个非常「人类」的动作，那就从技术栈、核心玩法、再到世界风格方面入手，逐步对接我的需求。
并且在它「施工」的过程中，我还能像个挑剔的甲方一样，开始在原来的需求上得寸进尺，随时插入新的想法：
光跑图太无聊了，得有经济系统，地上随机刷金币
加点动作元素吧，按J键射箭，按K键近战攻击
捡到的东西放哪？再给我加个背包UI，按I键唤出
路边的火柴人不能是摆设，我要能和NPC对话
等到最终运行的时候，效果简直可以用「尽善尽美」来形容：
既然号称是系统架构师，在GLM-5上架官网后，我也顺手让其打造了一个Mac系统。
虽然整体有些粗糙，但经典的屏幕背景，顶部状态栏的时间同步显示，底部Dock栏的图标排列都给「画」出来了。而且这上面的每一个应用，竟然真的都能打开。
适配半个芯片圈，这才是GLM-5的「大杀招」
基准测试结果显示，GLM-5在Coding与Agent能力上，取得开源SOTA表现。
数据不会撒谎，在SWE-bench-Verified和Terminal Bench 2.0这两个公认最难的编程榜单中，GLM-5分别拿下了77.8和56.2的高分，在真实编程场景的体感上，已经无限逼近Claude Opus 4.5。
GLM-5凭什么能做到这一点？翻看官方报告，在一堆参数背后，我们找到了几个关键点：MoE架构和异步强化学习（Asynchronous RL）。
744B的总参数量，激活参数只有40B，这让它足够聪明又足够轻量。但真正的杀手锏是智谱构建的全新「Slime」框架。
简单打个比方：以前的模型训练像是在「考试」，做对一道题给一个分，模型为了拿高分拼命背题；GLM-5的训练则像是「实习」，它在一个名为Slime的环境里，通过完成一个个完整的长程项目，在不断的反馈和交互中学习。
此外，它还首次集成了DeepSeek Sparse Attention（稀疏注意力机制）。这意味着在处理动辄几十万行代码的上下文时，它不仅不会「迷路」，还能大幅降低部署成本。
但最让我感慨的，是官方公告底部那串长长的致谢名单。国产大模型已经可以在国产芯片集群上，实现高吞吐、低延迟的稳定运行了。
华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光……
这几乎是中国半导体行业的「半壁江山」，这意味着，GLM-5的开源不仅仅是软件层面的胜利，它标志着国产AI生态——从底层的芯片算力，到中间的框架，再到上层的模型逐渐跑通了一个完整的闭环。
而随着GLM-5的开源，以及它与Claude Code、OpenCode等主流工具的打通，我们或许正站在软件工程2.0的门槛上。
特斯拉前AI总监Andrej Karpathy预言的「智能体工程」时代，比想象中来得更快。在未来，你可能不需要再逐行砌砖。你只需要定义系统，定义审美，定义什么是「好玩」和「有用」。
然后，看着GLM-5这样的大模型像包工头一样，指挥着底层的算力把高楼大厦盖起来。
传统的「码农」时代，可能真的要结束了。
但别慌，这不代表人类没用了。相反，当AI包办了实现的繁琐，你的审美、你的判断力、以及你提出一个好问题的能力，将成为人类最后的、也是最坚固的护城河。"

作者：新航娱乐

体验完智谱刚刚发布的GLM-5，我终于明白它为什么让硅谷猜破了头

新闻资讯 News

案例展示 Case

现在致电 xylmwohu OR 查看更多联系方式 →

现在致电 xylmwohu OR 查看更多联系方式 →