只会用聊天型大模型、最近开始想跟进 AI 新工具的人,最容易看错的一步,不是消息看少了,而是还在按“谁更聪明”筛东西。你刚刷到一条更新,本来想划走,又怕自己下一步已经慢半拍;真错的代价,是时间、预算和注意力会花错地方。

我现在的判断很简单:过去半年最大升级,不是更会聊天,是给模型装上手脚。也就是,它不只回答你,还开始替你走几步流程。这半年最重要的不是更聪明,是更能动手。[C002]

最能把这个判断钉住的一条公开信号,出现在 2026 年 3 月 11 日。OpenAI 把 shell 工具和托管工作区放进开发者工具里。白话一点,就是给模型一个命令框和一个临时电脑,不再只有聊天窗。这个细节值钱,不是因为功能名更多,而是因为它会改掉你下一步怎么看工具。

这也不是无人值守。这里只看 2025 年 12 月到 2026 年 3 月的公开发布,不是把每个模型都拉出来做实验;所以我现在先看它能不能在明确权限里碰工具、碰文件、碰网页,再看它能不能让人接管、回退、验收。

一条更新值不值得看,不看它列了多少功能,先看它会不会改掉你下一步的判断。如果你身边还有人还在只盯着谁更聪明,把这条转给他。The last six months in LLMs in five minutes。[C001]