提示词工程像站在后厨门口,对天才厨子喊一句“盐少放”;编排工程像把切配、热锅、试味、传菜全排好班。我判断得很直白:提示词工程正在让位给编排工程。

5 月 28 日,Anthropic 发了 Introducing dynamic workflows in Claude Code,又在 Introducing Claude Opus 4.8 里补充说明:Claude Code 不再只是接一句话、回一段代码,而是会自己拆任务、拉起几十到上百个并行小代理、互相挑错、进度中断还能续跑。说得再白一点,提示词从“驾驶杆”变成了“开工单”。

大家过去迷恋提示词工程,像迷恋咒语。总以为句子拧得越玄,模型就越听话。那是上一阶段的幻觉。弱一点的模型,确实像耳背店员,你得把话写成八股;强一点的模型,尤其是会调工具、会拆分任务、会长期运行的模型,已经不是“听你说话”的问题,而是“替你办事”的问题。办事最怕什么?不是口味不够文雅,是没人分工、没人复核、出了岔子没人接住。

模型越强,提示词越便宜;流程越长,编排越昂贵。

这才是这次更新里最反常识的地方。很多人以为模型更聪明,提示词工程会更值钱。恰恰相反。越聪明的工人,越不需要你把每个动词都喂到嘴边;越复杂的任务,越需要的是调度、验收、权限、上下文交接、失败重试。提示词是口味备注,编排才是后厨动线。

凌晨一点四十,值班工程师盯着报警群,支付服务偶发超时。旧办法是把报错贴给 Claude,问它“可能原因有哪些”。它会像一个会考试的学生,给你列四条答案。新办法不是问答,而是派工:一组去翻日志,一组追缓存命中,一组查数据库慢查询,一组沿着鉴权链路回溯;最后再拉另一组专门推翻前面的结论。你看到的不再是“也许如此”,而是一份带证据、带交叉验证的故障地图。这个时候,提示词像报案电话,工作流才像刑侦队。

单个模型再聪明,也只是会答题的状元;工作流一旦成形,它才像会带班的工头。

周三下午,一个老仓库要迁移:六百多个接口从旧版 SDK(软件开发工具包)换到新版,前端、测试、文档一个都跑不掉。靠提示词,AI 最多像一个勤快的实习生,改几处、漏几处、改完还得你从头巡街。靠编排,它先盘点受影响文件,再按模块拆批改动,再跑测试,再把失败的地方单独回炉。Anthropic 在文里给了更极端的样板:Bun 这套运行时工具,曾用动态工作流把一整片 Zig 编程语言代码迁到 Rust 编程语言,规模到七十五万行,十一天从第一笔提交走到合并,测试通过率接近原有基线。这里最稀缺的不是一句“请帮我优雅迁移”,而是那条能一直推着任务过河的流水线。

提示词工程解决的是一句话怎么说,编排工程解决的是一件事怎么成。

周五傍晚,上线前做安全审计。过去最常见的自欺,是让模型“帮我看看有没有漏洞”。这句话像请熟人吃饭时顺口问一句“菜够不够”,听着热闹,实际谁也不负责。动态工作流的思路完全相反:让一批代理专门找鉴权缺口、输入校验漏洞、危险调用;再让另一批代理专门负责抬杠,证明前面的发现是误报;最后把能站住脚的结果收拢回来。高风险任务最怕的不是 AI 犯错,最怕 AI 犯错以后还一本正经。编排工程的价值,恰恰是把“不许自信地胡说”写进了流程本身。

以前我们训练 AI 像教它说话,现在我们要雇它干活。

所以我对这次发布的判断,不是“Claude 又多了一个厉害功能”,而是软件生产的重心又挪了一寸。以前谁会写 prompt(提示词),谁像会背秘方;以后谁会做编排,谁才真正掌握产能。这个“编排”不是空洞的大词,它很具体:任务如何拆,哪些能并行,哪里要二次验证,何时交给人拍板,失败后怎么续跑,成本怎么控,权限怎么收。Anthropic 甚至给了一个 ultracode,本质上就是把“何时该拉起整套工作流”这件事,也部分交给 Claude 自己判断。提示词没有消失,但它正在退居二线,像车间墙上的操作说明,还在,却不再是工厂的灵魂。

未来的分水岭,不是谁会写 prompt,而是谁能把验证、回滚、并行和交接写进流程。

这件事再往深里看,变的不是软件,是人对机器的组织方式。上一代人与 AI 的关系,像对着一个聪明学生出题;这一代开始,像带一支看不见的施工队。学生时代讲究题目怎么问,施工时代讲究工序怎么排。前者迷恋措辞,后者迷恋产线;前者追求一句话把模型说服,后者追求一套机制把结果逼稳。

谁还把提示词当护身符,谁就像站在自动化后厨门口,反复琢磨菜单上的修辞,却没发现里面已经换成了流水线。真正的新工种,不是提示词诗人,而是 AI 的工头、监理和调度员。咒语不会彻底消失,但它已经从王座上下来,回到了它该待的位置:开场白。干活的时代,轮到编排上桌了。