像一个把菜谱讲成脱口秀的明星厨子,最后还是回到后厨最贵那口灶前看火,不端盘。Karpathy 加入 Anthropic,在我看来只说明一件事:最会讲AI的人,还是回到了最贵的训练层。
这不是普通跳槽,更不是又一个名字被挂上公司门楣。5月19日,Karpathy 去的不是产品前台,不是开发者宣讲,不是把 Claude 讲得更好听的位置;他去的是预训练团队。所谓预训练,就是让模型先吞下海量文本、代码和世界知识,熬出底味的那一层。汤鲜不鲜,决定后面整桌菜有没有资格摆盘。
反常识恰恰在这儿。过去一年,AI 圈最热闹的地方都在前厅:应用、入口、流程编排、代码助手,个个都像新商场的门脸,灯亮、人多、照相好看。Karpathy 恰恰是最会给这场热闹配解说的人。可真正懂火候的人,最后还是回厨房。因为前厅卖的是热闹,后厨管的是命门。
界面是门脸,训练是地契。
周三下午,一间十几人的会议室里,创业团队给客户演示“自动客服”。投屏很漂亮,流程很顺,按钮一层一层,把人往“智能化”推。客户忽然抛出一句行业黑话,模型答偏了,房间立刻静下来。产品经理改提示词,工程师补规则,销售脸上那点笑意像端盘子时强行稳住的汤。两周后,上游模型换了一版,同样的界面突然灵了,原先那些补丁像旧创可贴一样卷边脱落。这里最值钱的,从来不是桌上的菜单,而是后厨那锅底汤。
应用层卖的是借来的聪明,训练层铸的才是自己的本金。
周六晚上,一个程序员窝在出租屋里,用 Cursor 搭后台。半小时里,他让代码自己起骨架、补接口、改报错,成就感像第一次摸到电。朋友圈会把这解释成“人人都能做软件了”。话好听,但不够狠。真相是:他之所以能“vibe coding(凭感觉写代码,让模型补全细节)”,不是因为感觉突然变贵了,而是因为背后的模型在预训练里吞过足够多的 GitHub 仓库、文档和报错记录。你以为自己在跟AI对话,其实你在消费别人提前烧掉的电。
会讲AI的人回到训练层,不是退回实验室,是回到铸币厂。
再换一个画面。不是发布会,而是机房。风扇声像一排电水壶同时烧开,研究员盯着训练误差曲线往下挪零点几个百分点。外行看见的是小数点,行内人看见的是水位线:更少的胡说八道,更长的推理,更稳的写码,更低的成本。4月20日,Anthropic 公开宣布,为训练和部署 Claude 锁下未来十年的海量算力,对亚马逊技术的承诺超过一千亿美元;更早之前,它连高管分工都把重心压回预训练。钱往哪层砸,人往哪层聚,行业的真信仰就写在哪层。
一个行业真正信什么,不看它在发布会上说什么,要看它把最贵的人和最贵的电,摆在哪里。
所以我不把这件事看成一条猎头新闻,我把它看成一份行业自白。AI 这些年一直在制造一种错觉:好像门槛越来越低,人人都能搭个应用,人人都能当半个发明家,人人都能借模型说几句漂亮话。这错觉并不假,只是不完整。它像让你在餐厅里随便点菜,于是你误以为自己拥有厨房。其实你拥有的只是点单权,真正决定味道的,仍然是那口最贵的灶。
Karpathy 这种人,原本最适合站在台前。他能把复杂模型讲得像拆钟表,也能把技术幽默讲得像街边评书。可一个最能解释AI的人,最后投奔的不是解释层,而是训练层;不是包装层,而是底料层。这里面的意思,再明白不过:可以靠讲解吃到红利,可以靠应用赚到门票,真正决定牌桌高低的,还是那层最费钱、最枯燥、也最不民主的训练。
能把未来说得动听的人很多,能把未来先训出来的人太少。
前厅永远热闹,帝国永远建在后厨。
公开信息可见:Axios 关于 2026 年 5 月 19 日 Karpathy 加入 Anthropic 预训练团队的报道,Anthropic 2026 年 4 月 20 日关于长期算力投入的公告,Anthropic 2025 年 10 月 7 日关于预训练组织重心的公告。