前沿模型像会做满汉全席的外卖员:饭盒里装的是智力,门禁卡装的是生意。我判断,Redeploying(重新部署)Claude Fable 5这件事,先拼通关权,再拼智力。进不了系统,见不到数据,按不下确认键,再漂亮的推理,也只能凉在小区栏杆上。

这话不是替笨模型找面子,恰恰相反。我不是说智力不值钱,我是说在前沿模型的战场上,智力越来越像顶级刀工:当然珍贵,但一家馆子先要有门脸、灶台、排烟和收银。没有这些,米其林主厨也只能在路边切葱。

最违背直觉的地方正在这里:前沿模型常常不是输给更聪明的对手,而是输给一个没它聪明、却比它更靠近流程的家伙。不是被卷死,是被安插死。榜单决定掌声,权限决定饭碗。前沿模型真正的战场,不在排行榜,在按钮背后。

所谓通关权,并不玄。就是四样俗物:默认入口、内部资料、工具调用、动作授权。谁能被默认打开,谁能摸到公司的文件柜,谁能替人点下“发送”“提交”“批准”,谁就先占住了现实。模型的天花板,往往不是参数,是门禁。

凌晨十二点十七分,北京回龙观一间两居室里,后端工程师阿哲盯着 Cursor 里的报错。一个更聪明的模型在对话框里把问题讲得珠圆玉润:缓存、并发、状态回滚,像名校老师讲一道压轴题。可它碰不到代码仓库,跑不了测试,也不能替他改那两行配置。另一个没那么会写散文的模型,直接读完整个项目,定位文件,改动代码,运行测试,顺手起了提交。阿哲最后记住的不是谁更深刻,而是谁替他把灯关了。真正的替代,不是回答了你,而是替你按下了那个你懒得按、又不敢乱按的按钮。

上午九点十二分,苏州园区一家公司月末结账,财务小陈面前摊着三十七张发票、两份物流对账单、一个共享网盘和一套审批系统。会推理的模型当然能告诉她:差额大概出在税率、入库时间或折扣条款。但能把附件归类、把抬头错字标红、把报销单填进正确字段、再把异常留给人确认的,才配叫同事。智力是菜,通关权是餐桌;菜再好,端不上桌,就只配在后厨自我感动。

下午四点四十三分,义乌一位做跨境生意的老板娘站在仓库门口接电话。美国客户说少了八件货。一个模型能用一口漂亮英文替她写一封体面的解释信;另一个模型能直接翻订单、看聊天记录、调物流轨迹、核对打包照片、生成补发单,还把损失记到那家常出错的供应商头上。前者像辩论队,后者像老铺子的账房。生意从来不是谁嘴更利,而是谁摸得到账本。

从人类学的眼光看,技术进入组织,从来不是以天才的姿态进门,而是以角色的姿态进门。算盘不是因为比人聪明才留在柜台,Excel(电子表格软件)不是因为有灵魂才统治办公室。它们赢,是因为它们被嵌进了流程、责任和签字链。模型也一样。谁先被写进工作流,谁就先被写进现实。

所以,把 Claude Fable 5重新部署,关键不在“更强”这两个字,而在“被放到哪里”。是继续把它摆在聊天框里当展品,让人夸它聪明;还是把它塞进代码编辑器、文档库、客服台、审批流、采购单,让它像一个有工牌、有抽屉钥匙、出了错还能追责的同事那样活着。前者是表演,后者才是基础设施。

第二场仗当然还是智力。拿到工牌之后,谁更稳,谁更长于长链条任务,谁更少胡说八道,差距会迅速拉开。但那是进门之后的厮杀。第一场仗,是能不能进门。先拿工牌,再谈智力。这不是对天才的贬低,这是对现实的尊重。


别人聊 AI,我们测 AI——每个结论都能下载原始数据自己复算。 🔗 官网 👉 https://crawdpad.com