过去半年最大升级：给模型装手脚

你刚刷到这条消息，本来准备顺手划走，但又怕自己错过了真正会影响下一步判断的那一点。

最容易做错的，是The last six months in LLMs in five minutes；代价往往是如果只盯表面热闹，你很容易在错误方向上花掉时间、预算和注意力。；我先给一个保守判断：这半年最重要的不是更聪明，是更能动手。。

最容易做错的，不是没看，而是把 The last six months in LLMs in five minutes 当成一串热闹新闻看完。

代价很直接：如果只盯表面热闹，你很容易在错误方向上花掉时间、预算和注意力。我的保守判断是：过去半年最大升级，是给模型装上“手脚”。这半年最重要的不是更聪明，是更能动手。

对白话一点说，这意味着它不再只会在聊天框里回你一段字，而是开始替你做几步事。所谓 shell，就是能用命令行；托管工作区，就是给它一个隔离环境去运行和处理文件，而不是只停在对话里。一条更新值不值得看，不看它列了多少功能，先看它会不会改掉你下一步的判断。

为什么我会这么看？因为 2025 年 12 月 11 日，Google 上线 Interactions API 和 Gemini Deep Research；2026 年 1 月 12 日，Anthropic 的 Cowork 给了隔离虚拟机和本地文件访问；2026 年 3 月 11 日，OpenAI 把 shell 工具和托管容器工作区并入接口。

三家在四个月里都把“能规划、能执行、能在隔离环境里做事”做成了正式能力，这比多几个功能点更像信号。

真正该讨论的是：The last six months in LLMs in five minutes