这11个demo(演示片段),像年夜饭上把一条鱼剁成十一碟:桌子看着阔,筷子夹来夹去还是那一条。我看得很明确:这9个demo,本质只押对话剪辑、子代理、即席UI(临时拼出来的界面)。剩下的热闹,多半只是摆盘。

看 Gemini(谷歌的大模型)Omni 和 Gemini 3.5 这类演示,最容易被灯光带跑。观众盯着的是“它更像人了”,我盯着的是“它终于更像一个产品了”。这不是脑子忽然开天眼,而是后台终于装上了剪辑台、分拣线和临时柜台。

今天的大模型竞争,七分比导演,三分比演员。

为什么我敢这么说?因为真正让人拍桌子的,不是答案本身,而是过程被处理得像魔术。对话一顺,观众就忘了中间本来会有卡壳;任务一拆,观众就误以为来了个全能秘书;界面一弹,观众就把“终于收口”错认成“它更懂我”。

周一早上八点四十,望京一间律所里,实习生小陈一手豆浆一手鼠标,对着电脑说:把昨晚那份合同里所有违约责任挑出来,顺手给客户起一封邮件,再把下午会上要问的三件事列出来。真实世界里的系统不会这么乖。它会听错公司名,会抓错附件版本,会把第三件事插到第一件前头。可演示片段不拍这些。它像一个精于删减的剪辑师,把犹豫、返工、重试都扫到镜头外,只留下一条丝滑的表演线。于是观众以为智力跃迁了,其实先跃迁的是叙事手艺。

演示片段最会骗人的地方,不是它说了什么,而是它把失败剪掉了。

这就叫对话剪辑。它不新鲜,甚至有点像短视频平台的老本行:不是让事情真的更顺,而是让你只看到顺的那一段。技术公司最爱把这件事说成“自然交互”,仿佛机器终于学会了体贴。说穿了,不过是把本来该暴露的停顿、澄清和重试,藏进后台。

周三晚上十点半,杭州城西一个做宠物用品的卖家小周,后台同时炸出七条消息:德国客户问税,美国客户催补发,仓库说某款断货,平台又推来一条差评。真能救命的,从来不是一个会长篇大论的总管,而是几个肯干脏活的小工:一个查物流,一个读规则,一个起草回复,一个算补偿,最后再有人把这些碎活拢成一句能发出去的人话。所谓子代理,说白了,就是把一个任务拆给几个小助手,各干各的,再回来交账。

子代理不是天才分身,是把一个笨老板装成一支忙碌的后厨。

这也是为什么我说,许多演示真正押的是劳动组织,不是智力神迹。人们以为自己在看一个“更聪明”的模型,其实是在看一套“更会分工”的流水线。厨房里一道菜突然出得快,不一定是大厨悟道了,也可能只是终于有人负责切葱、有人负责看火、有人负责擦盘边。技术公司最爱把厨房说成宇宙,因为宇宙卖得贵,厨房听起来像小生意。可真正挣钱的,偏偏常是厨房。

周六下午三点,深圳龙华一家口腔诊所前台,阿姨对着病人连问四轮:姓名、过敏史、预约时间、想做检查还是治疗。你要是让系统一直陪聊,它会像个过分热心的亲戚,什么都接,偏偏收不住。真正高明的一步,是聊到第三句,界面突然长出三格小表:时间、项目、预算,点两下,信息落地。这就是即席UI。聊到关键处,不再硬撑“全靠对话”,而是临时摆出按钮、卡片、表单,把含糊的人话拧成可执行的结构。

真正有效的界面,不是让人多说一句话,而是让人少填三张表。

很多人把“全程聊天”想得过于浪漫,好像语言本身可以包办一切。其实语言最擅长的是暧昧,表单最擅长的是算账。一个成熟的系统,应该知道什么时候陪你说,什么时候叫你点。会聊天只是门面,会收口才是手艺。

至于为什么我说是九个,不是十一个?因为总有两段,不过是在重复证明一件早就该有的事:它能听、能看、能说。那像饭馆门口亮明厨、摆活鱼,是入场券,不是下注。真正的下注,是怎么把过程剪顺,怎么把活拆开,怎么把信息收口。

人们以为自己在看大脑,其实看的是车间改造。

所以我对这11个演示片段的判断很简单,也很不客气:它们并没有展示一个新物种突然降临,它们展示的是产品工业终于学会了怎么伺候大模型。模型负责出声,剪辑负责抹平窘态,子代理负责跑腿,即席UI负责收尾。热闹看上去像思想革命,拆开却是一场流程革命。

蒸汽机并没有让煤更聪明,它只是让工厂改了钟点。今天这些系统也一样,它们未必先让机器更有灵魂,它们先让办公室重排动作,让原本散在嘴上、手上、表格里、窗口间的活,变成一条可以调度的线。谁把这条线攥紧,谁就不是在做玩具,而是在接管工作。

说到底,这11碟菜并不神秘。鱼还是那条鱼,真正变的是刀工、后厨和上菜口。神话往往穿长袍,生意通常系围裙。