企业买编码代理,不是在工位上领一只会背接口文档的鹦鹉,而是在仓库里放进一台会自己跑的叉车。叉车先看刹车、围栏和行车记录仪,再看马力。我判断这次 OpenAI 被 Gartner(科技咨询机构)列为企业编码代理领导者,值钱就值钱在这儿:企业采购代理,先买可控性,再买智商。

外面的人还在争谁更聪明,会议室里早换了题。大公司不是先问“它能不能三分钟写完一个功能”,而是先问“它改了谁的仓库,调了哪些工具,谁批的,出了事能不能回放”。前者像看魔术,后者像给叉车上牌。消费者追求惊艳,采购部门追求追责。

这也是这次评估真正耐人寻味的地方。行业早先比的是“像不像天才实习生”,现在比的是“像不像合格基础设施”。Gartner把风向说得很明白:这一轮竞争,已经从“神奇的开发体验”,转向运营成熟、商业清晰、企业就绪。它甚至判断,到 2027 年,使用这类代理式编码的工程团队里,超过 65% 会把 IDE(集成开发环境,也就是程序员写代码的主界面)当成可选项,真正的控制、治理和验证,会转到自动化平台上。说得更直白一点:键盘退位,闸机上台。

你看三个场景就明白了。

周三上午十点,上海一家银行的软件平台主管演示一个编码代理。屏幕上,它三分钟修掉一段十年没人敢碰的结算旧代码,会议室里有人低声说“真快”。下一秒,安全负责人只问了一句:它默认能不能碰生产凭证库?屋里立刻安静。预算的去向,常常就死在这一下安静里。企业不是怕 AI 不会写代码,企业怕它写了以后,没人知道它碰过什么。

周五晚上十一点,广州一家跨境电商的支付组把依赖升级交给代理。它一口气改了 12 个仓库,11 个通过,1 个把汇率取整从“四舍五入”拧成了“向下截断”。真正救命的,不是它第二天能不能写出一篇漂亮的解释,而是系统有没有把那次改动关在沙箱里,有没有审批闸门,有没有留下完整轨迹。在企业里,最贵的不是一次写错,而是没人说得清它为什么写错。

周一下午四点,北京一家车企的采购专员对着四十多页评估表,问的不是“模型参数多大”,而是“日志留存多久,权限能不能分级,离职员工多久回收访问权,断网环境能不能部署,半夜出问题谁接电话”。这张表很不浪漫,但专治技术圈的恋爱脑。模型智商决定天花板,可控性决定能不能进大门。

所以,OpenAI 这次被放进领导者位置,真正有分量的,并不只是 GPT 更会写了。OpenAI 自己摆出的招牌,是 Codex 每周有 400 万人在用,以及 Cisco、Datadog、Dell、NVIDIA 这类企业客户。那当然说明势能。但真正让采购单落笔的,不是热度,而是 Codex(OpenAI 的编码代理产品)在往企业真正要的那一层长:不只是一张会答题的嘴,而是一整套可部署、可审批、可审计、可约束的工作系统。应用、插件、命令行、开发工具包是它的手脚;审批闸门、角色权限、沙箱、审计治理是它的筋骨。连它最近往混合部署和本地部署上走,本质也不是炫技,而是把叉车开进那些最怕失火的仓库。

这件事的反常识之处就在这里:企业采购代理,买的不是“最像人”的东西,而是“最能被制度消化”的东西。一个聪明得像神童、却不能关进流程的代理,对大公司来说,不是资产,是游荡的权限。能被批准部署的聪明,才算企业级聪明。

再往深一层看,这甚至不只是 OpenAI 的新闻,而是整个软件劳动在换骨头。过去是人用工具写代码;现在越来越像人站在闸口,放一群受限的代理去跑流程、提改动、过测试、等复核。代码当然还是代码,但组织关系已经变了。你交给代理的不是一张任务单,而是一串钥匙;你买的也不是一个答案,而是一套边界。

我对这件事的判断很明确:Gartner 这次点名 OpenAI,表面是在给一家厂商排座次,骨子里是在给整个市场改考卷。昨天大家买大模型,先看智商;今天企业买代理,先看可控性。会写代码,只是入场券。能被治理,才是门票。