先装刹车，再买智商

企业买编码代理，不是在工位上领一只会背接口文档的鹦鹉，而是在仓库里放进一台会自己跑的叉车。叉车先看刹车、围栏和行车记录仪，再看马力。我判断这次 OpenAI 被 Gartner（科技咨询机构）列为企业编码代理领导者，值钱就值钱在这儿：企业采购代理，先买可控性，再买智商。

外面的人还在争谁更聪明，会议室里早换了题。大公司不是先问“它能不能三分钟写完一个功能”，而是先问“它改了谁的仓库，调了哪些工具，谁批的，出了事能不能回放”。前者像看魔术，后者像给叉车上牌。消费者追求惊艳，采购部门追求追责。

这也是这次评估真正耐人寻味的地方。行业早先比的是“像不像天才实习生”，现在比的是“像不像合格基础设施”。Gartner把风向说得很明白：这一轮竞争，已经从“神奇的开发体验”，转向运营成熟、商业清晰、企业就绪。它甚至判断，到 2027 年，使用这类代理式编码的工程团队里，超过 65% 会把 IDE（集成开发环境，也就是程序员写代码的主界面）当成可选项，真正的控制、治理和验证，会转到自动化平台上。说得更直白一点：键盘退位，闸机上台。

你看三个场景就明白了。

周三上午十点，上海一家银行的软件平台主管演示一个编码代理。屏幕上，它三分钟修掉一段十年没人敢碰的结算旧代码，会议室里有人低声说“真快”。下一秒，安全负责人只问了一句：它默认能不能碰生产凭证库？屋里立刻安静。预算的去向，常常就死在这一下安静里。企业不是怕 AI 不会写代码，企业怕它写了以后，没人知道它碰过什么。

周五晚上十一点，广州一家跨境电商的支付组把依赖升级交给代理。它一口气改了 12 个仓库，11 个通过，1 个把汇率取整从“四舍五入”拧成了“向下截断”。真正救命的，不是它第二天能不能写出一篇漂亮的解释，而是系统有没有把那次改动关在沙箱里，有没有审批闸门，有没有留下完整轨迹。在企业里，最贵的不是一次写错，而是没人说得清它为什么写错。

周一下午四点，北京一家车企的采购专员对着四十多页评估表，问的不是“模型参数多大”，而是“日志留存多久，权限能不能分级，离职员工多久回收访问权，断网环境能不能部署，半夜出问题谁接电话”。这张表很不浪漫，但专治技术圈的恋爱脑。模型智商决定天花板，可控性决定能不能进大门。

所以，OpenAI 这次被放进领导者位置，真正有分量的，并不只是 GPT 更会写了。OpenAI 自己摆出的招牌，是 Codex 每周有 400 万人在用，以及 Cisco、Datadog、Dell、NVIDIA 这类企业客户。那当然说明势能。但真正让采购单落笔的，不是热度，而是 Codex（OpenAI 的编码代理产品）在往企业真正要的那一层长：不只是一张会答题的嘴，而是一整套可部署、可审批、可审计、可约束的工作系统。应用、插件、命令行、开发工具包是它的手脚；审批闸门、角色权限、沙箱、审计治理是它的筋骨。连它最近往混合部署和本地部署上走，本质也不是炫技，而是把叉车开进那些最怕失火的仓库。

这件事的反常识之处就在这里：企业采购代理，买的不是“最像人”的东西，而是“最能被制度消化”的东西。一个聪明得像神童、却不能关进流程的代理，对大公司来说，不是资产，是游荡的权限。能被批准部署的聪明，才算企业级聪明。

再往深一层看，这甚至不只是 OpenAI 的新闻，而是整个软件劳动在换骨头。过去是人用工具写代码；现在越来越像人站在闸口，放一群受限的代理去跑流程、提改动、过测试、等复核。代码当然还是代码，但组织关系已经变了。你交给代理的不是一张任务单，而是一串钥匙；你买的也不是一个答案，而是一套边界。

我对这件事的判断很明确：Gartner 这次点名 OpenAI，表面是在给一家厂商排座次，骨子里是在给整个市场改考卷。昨天大家买大模型，先看智商；今天企业买代理，先看可控性。会写代码，只是入场券。能被治理，才是门票。