半夜两点,厨房水管爆了,水已经漫到脚背,有人不去关总阀,先蹲在手机前挑最贵的扳手。我觉得现在不少团队做 AI(人工智能)编程,就是这副样子:AI编程先要复盘,不是先换模型。代码怎么坏的没弄清,需求哪里漏了没问明,换模型,不过是给漏水的房子换一盏更亮的灯。

反常识恰恰在这里:多数人以为模型越强,越能替你跨过混乱;我看正相反,模型越强,越会把你的混乱放大。一个含糊的人,配上一台能干的机器,往往不是如虎添翼,而是醉汉骑快马。

模型像发动机,复盘像方向盘。车都开进沟里了,先别夸马力。

上个月,一个做订货后台的小组卡在“确认发货”按钮。晚上十一点,小周在 Cursor 里先叫 Claude 改,再换 GPT 重写。AI 一会儿让按钮灰掉,一会儿让页面跳转,一会儿把库存提前扣了。三小时里,代码像拉面,被来回抻得越来越长。第二天,产品经理拿纸画了八步流程:什么时候允许撤回,什么情况要二次确认,库存是付款后扣还是扫码后扣。图一清楚,前一晚被骂“不懂业务”的模型,十分钟就把页面和接口一起补齐。问题从来不是模型笨,是人拿着一团雾去问路。

AI 没有读心术,它只会把你的含糊翻译成事故。

还有个后端工程师老何,写退款脚本。报错一出来,他把堆栈一贴,扔给 AI:“修一下。” AI 连给三版,都有坑:重复执行会二次退款,失败不回滚,日志散得像打翻一地玻璃珠。老何骂模型不可靠。后来他自己坐下来复盘,只补了四句话:这笔钱不能重复退;脚本中断要能重跑;第三方接口超时要先记账后补偿;每一笔操作都要追到订单号。换的不是模型,变的是题目。题目一旦从“修一下”变成“在这些边界里修”,机器才开始像助手,不像算命先生。

换模型是在换刀,复盘是在认伤口。伤口没认清,刀越快,剁得越深。

最典型的是测试。小林接手一个老仓库,要补注册流程的自动测试。他一下午都在切模型,像病人换挂号科室:这个说元素找不到,那个说路由断言不对。可仓库里真正的病灶,是测试环境两年没收拾:同一个接口有三个别名,假数据脚本早就过期,项目说明文件还写着上任同事的老端口。等他们花一小时把前置条件写清,把最小用例跑通,昨天还被嫌弃的模型,晚上就把剩下七个用例补完。很多人说 AI 不稳定,其实稳定的是混乱,AI 只是忠实复印。

不复盘的团队,不是在使用 AI,而是在给混乱装电机。

这背后其实很像一场现代祭祀。古人收成不好,会怀疑锄头、风水、神像;今天项目卡住了,大家第一反应是模型不够新。为什么?因为换工具比查自己容易,升级订阅比承认流程烂体面。复盘之所以总被拖到最后,不是因为它最费时间,而是因为它最伤自尊。它逼你承认:有些错误不是技术问题,是任务说得太软,边界写得太糊,验收像棉花,最后又把判断偷懒地塞给了机器。

我说的复盘,不是会后那种“收获很多,下次继续”的作文比赛。复盘更像验尸:这次到底死在哪一步,AI 当时拿到了什么,它在哪个岔路口走偏,这个偏差该靠更清楚的上下文、写死的验收,还是靠测试拦住。前两项不清,换一百个模型都只是轮流碰壁;后两项一清,小模型也能干大活。

真正贵的不是模型订阅费,是每次出错后还不肯回头看的自尊。

所以我判断,AI 编程真正的分水岭,不在于你有没有追上最新模型,而在于你有没有把自己的工作过程,做成一个能被机器接住的形状。会复盘的团队,普通模型也能用成生产工具;不会复盘的团队,顶级模型也只会沦为文采更好的替罪羊。

今天不少人谈 AI 编程,像在谈一味灵药:换个牌子,药效立刻翻倍。可工程从来不是吃药,它更像做饭。菜咸了,不先承认自己盐放重了,却忙着换锅、换火、换铲子,最后端上桌的,只会是一盘更复杂的难吃。

先复盘,不是保守,是尊重现实。现实从不因为你换了模型就改口;它只认两件事:问题有没有被说准,错误有没有被关住。该升级的,往往不是 AI 的脑子,而是人的工作方式。