Karpathy回了最贵那口灶

像一个把菜谱讲成脱口秀的明星厨子，最后还是回到后厨最贵那口灶前看火，不端盘。Karpathy 加入 Anthropic，在我看来只说明一件事：最会讲AI的人，还是回到了最贵的训练层。

这不是普通跳槽，更不是又一个名字被挂上公司门楣。5月19日，Karpathy 去的不是产品前台，不是开发者宣讲，不是把 Claude 讲得更好听的位置；他去的是预训练团队。所谓预训练，就是让模型先吞下海量文本、代码和世界知识，熬出底味的那一层。汤鲜不鲜，决定后面整桌菜有没有资格摆盘。

反常识恰恰在这儿。过去一年，AI 圈最热闹的地方都在前厅：应用、入口、流程编排、代码助手，个个都像新商场的门脸，灯亮、人多、照相好看。Karpathy 恰恰是最会给这场热闹配解说的人。可真正懂火候的人，最后还是回厨房。因为前厅卖的是热闹，后厨管的是命门。

界面是门脸，训练是地契。

周三下午，一间十几人的会议室里，创业团队给客户演示“自动客服”。投屏很漂亮，流程很顺，按钮一层一层，把人往“智能化”推。客户忽然抛出一句行业黑话，模型答偏了，房间立刻静下来。产品经理改提示词，工程师补规则，销售脸上那点笑意像端盘子时强行稳住的汤。两周后，上游模型换了一版，同样的界面突然灵了，原先那些补丁像旧创可贴一样卷边脱落。这里最值钱的，从来不是桌上的菜单，而是后厨那锅底汤。

应用层卖的是借来的聪明，训练层铸的才是自己的本金。

周六晚上，一个程序员窝在出租屋里，用 Cursor 搭后台。半小时里，他让代码自己起骨架、补接口、改报错，成就感像第一次摸到电。朋友圈会把这解释成“人人都能做软件了”。话好听，但不够狠。真相是：他之所以能“vibe coding（凭感觉写代码，让模型补全细节）”，不是因为感觉突然变贵了，而是因为背后的模型在预训练里吞过足够多的 GitHub 仓库、文档和报错记录。你以为自己在跟AI对话，其实你在消费别人提前烧掉的电。

会讲AI的人回到训练层，不是退回实验室，是回到铸币厂。

再换一个画面。不是发布会，而是机房。风扇声像一排电水壶同时烧开，研究员盯着训练误差曲线往下挪零点几个百分点。外行看见的是小数点，行内人看见的是水位线：更少的胡说八道，更长的推理，更稳的写码，更低的成本。4月20日，Anthropic 公开宣布，为训练和部署 Claude 锁下未来十年的海量算力，对亚马逊技术的承诺超过一千亿美元；更早之前，它连高管分工都把重心压回预训练。钱往哪层砸，人往哪层聚，行业的真信仰就写在哪层。

一个行业真正信什么，不看它在发布会上说什么，要看它把最贵的人和最贵的电，摆在哪里。

所以我不把这件事看成一条猎头新闻，我把它看成一份行业自白。AI 这些年一直在制造一种错觉：好像门槛越来越低，人人都能搭个应用，人人都能当半个发明家，人人都能借模型说几句漂亮话。这错觉并不假，只是不完整。它像让你在餐厅里随便点菜，于是你误以为自己拥有厨房。其实你拥有的只是点单权，真正决定味道的，仍然是那口最贵的灶。

Karpathy 这种人，原本最适合站在台前。他能把复杂模型讲得像拆钟表，也能把技术幽默讲得像街边评书。可一个最能解释AI的人，最后投奔的不是解释层，而是训练层；不是包装层，而是底料层。这里面的意思，再明白不过：可以靠讲解吃到红利，可以靠应用赚到门票，真正决定牌桌高低的，还是那层最费钱、最枯燥、也最不民主的训练。

能把未来说得动听的人很多，能把未来先训出来的人太少。

前厅永远热闹，帝国永远建在后厨。

公开信息可见：Axios 关于 2026 年 5 月 19 日 Karpathy 加入 Anthropic 预训练团队的报道，Anthropic 2026 年 4 月 20 日关于长期算力投入的公告，Anthropic 2025 年 10 月 7 日关于预训练组织重心的公告。