你刚刷到这条消息,本来准备顺手划走,但又怕自己错过了真正会影响下一步判断的那一点。

最容易做错的,是The last six months in LLMs in five minutes;代价往往是如果只盯表面热闹,你很容易在错误方向上花掉时间、预算和注意力。;我先给一个保守判断:这半年最重要的不是更聪明,是更能动手。。

最容易做错的,不是没看,而是把 The last six months in LLMs in five minutes 当成一串热闹新闻看完。

代价很直接:如果只盯表面热闹,你很容易在错误方向上花掉时间、预算和注意力。我的保守判断是:过去半年最大升级,是给模型装上“手脚”。这半年最重要的不是更聪明,是更能动手。

对白话一点说,这意味着它不再只会在聊天框里回你一段字,而是开始替你做几步事。所谓 shell,就是能用命令行;托管工作区,就是给它一个隔离环境去运行和处理文件,而不是只停在对话里。一条更新值不值得看,不看它列了多少功能,先看它会不会改掉你下一步的判断。

为什么我会这么看?因为 2025 年 12 月 11 日,Google 上线 Interactions API 和 Gemini Deep Research;2026 年 1 月 12 日,Anthropic 的 Cowork 给了隔离虚拟机和本地文件访问;2026 年 3 月 11 日,OpenAI 把 shell 工具和托管容器工作区并入接口。

三家在四个月里都把“能规划、能执行、能在隔离环境里做事”做成了正式能力,这比多几个功能点更像信号。

真正该讨论的是:The last six months in LLMs in five minutes