过去半年最大升级：不是更聪明，是给模型装上手脚

只会用聊天型大模型、最近开始想跟进 AI 新工具的人，最容易看错的一步，不是消息看少了，而是还在按“谁更聪明”筛东西。你刚刷到一条更新，本来想划走，又怕自己下一步已经慢半拍；真错的代价，是时间、预算和注意力会花错地方。

我现在的判断很简单：过去半年最大升级，不是更会聊天，是给模型装上手脚。也就是，它不只回答你，还开始替你走几步流程。这半年最重要的不是更聪明，是更能动手。[C002]

最能把这个判断钉住的一条公开信号，出现在 2026 年 3 月 11 日。OpenAI 把 shell 工具和托管工作区放进开发者工具里。白话一点，就是给模型一个命令框和一个临时电脑，不再只有聊天窗。这个细节值钱，不是因为功能名更多，而是因为它会改掉你下一步怎么看工具。

这也不是无人值守。这里只看 2025 年 12 月到 2026 年 3 月的公开发布，不是把每个模型都拉出来做实验；所以我现在先看它能不能在明确权限里碰工具、碰文件、碰网页，再看它能不能让人接管、回退、验收。

一条更新值不值得看，不看它列了多少功能，先看它会不会改掉你下一步的判断。如果你身边还有人还在只盯着谁更聪明，把这条转给他。The last six months in LLMs in five minutes。[C001]