在医院里,拍病人肩膀不收费,读懂造影片才收费。ChromeDevTools(谷歌浏览器开发者工具)也是这样。我一直觉得,真正值钱的不是点击,是把瀑布图变成上下文。chrome-devtools-mcp(把这套工具接给 AI 调用的桥)若只被拿来“让 AI 会点网页”,等于给听诊器配了根更快的手指,热闹,但便宜。
市场最爱看热闹。浏览器里一个按钮被点下去,登录成功,表单提交,页面跳转,像马戏团里狮子钻火圈,观众立刻鼓掌:真聪明,AI 会用了。可点击这件事,本质上是体力活的高级伪装。今天是点“提交”,明天是点“下一步”,后天是绕过弹窗再点“确认”。这叫熟练,不叫理解。
理解发生在幕布后面。一个页面看上去只有一张脸,背后却站着一整个家族:接口、脚本、缓存、重定向、实验桶、权限、第三方埋点。瀑布图之所以值钱,不是因为它花花绿绿,像技术人员的山水画;而是因为它把“谁先来、谁迟到、谁撒谎、谁装死”按时间排成了口供。把瀑布图变成上下文,意思不是看见几十条请求;而是看懂因果链:为什么这个按钮表面点了,生意实际上没成。
截图只给你脸色,瀑布图才给你病史。
凌晨一点二十七分,杭州一个做跨境电商的运营盯着支付页,群里已经炸了。页面上的“立即付款”能点,点下去也有加载小圆圈,十秒后又静悄悄回来,像一个装忙的门童。普通自动化脚本很勤快,能把这个按钮点上一百次,点得比人还虔诚。但 ChromeDevTools 一打开,事情就换了面目:营销插件的脚本卡了 3.8 秒,刷新令牌的接口晚到了半拍,真正的下单请求被重定向到登录页,页面却没把这个失败抬到脸上。问题从来不是“按钮没反应”,而是三拨人马在后台互相扯袖子。会点的人以为门坏了,会看瀑布图的人知道,是门后面那串钥匙没对上齿。
页面上的每一次转圈,背后都不是“慢”,而是谁在欠谁的账。
第二天上午十点,一个做企业采购后台的前端新人,被领导叫进会议室。客户说系统“偶发性白屏”,最讨厌的四个字,就是“偶发性”:像民间传说,谁都听过,谁都没见过。新人照着录屏操作,登录、切页、筛选,一切正常。要是只比点击,这种问题根本无从下手,因为每一次复现都像在摸一条光滑的鱼。后来把浏览器后台扒开看,才发现真正的戏在七次重定向里:单点登录的 Cookie(网站留在浏览器里的身份小纸条)在跨域跳转时掉了一次,页面壳子加载出来了,数据接口却被当成游客挡在门外。白屏不是“页面空了”,白屏是前台已经开门,后台还在查户口。
这就是反常识的地方:越是看起来像“操作问题”的故障,越可能不是操作问题;越是被围观成“AI 会不会点”的能力,越不决定价值。点击只证明你碰到了门把手。上下文才证明你知道这栋楼的结构。
会点按钮的 AI,像勤快店员;看懂调用链的 AI,才像掌柜。
再看第三个场景。周六下午,一个独立开发者把 chrome-devtools-mcp 接上模型,想让 AI 帮他修首页。表面症状很滑稽:页面标题和按钮都在,唯独商品列表像被神仙点化过,留白,干净,什么都没有。过去很多“会用浏览器”的 AI 在这里会开始表演:刷新、滚动、重试、换标签页、再点一次,像一个认真但没见过世面的学徒。接上开发者工具后,情况完全不同。它能直接看到控制台里一行红字,看到配置文件返回 404,看到数据接口根本没发出去,因为一个基础路径被写成了旧目录。这里真正被修掉的,不是“白屏”,而是误解。AI 第一次不是在屏幕表面摸索,而是在后台读账本。
把工具接给 AI,不是给它一根手指,是给它一副听诊器。
所以我对 ChromeDevTools 和 chrome-devtools-mcp 的判断一直很明确:它们最重要的,不是把浏览器自动化这点旧手艺重新刷一层智能油漆,而是把网页从“可点击物体”还原成“有因果、有关系、有历史的现场”。这事像什么?像你以前只会看舞台上的演员哭,现在终于能走到后台,看见谁拿错了道具,谁忘了台词,谁的灯光晚亮了两秒,谁在谢幕前偷偷把电闸拉了。
技术圈有个毛病,爱把热闹当价值。能演示的东西最容易融资,也最容易误导。一个 AI 点开网页、输入账号、勾选复选框,人人看得懂,所以人人以为那是高门槛。恰恰相反,这类能力最容易贬值,因为它只是在模仿人的手。手从来不是稀缺品,稀缺的是把杂乱信号压成判断,把局部异常放回全局关系里。说得再直白一点:点击是劳务,上下文是资产。
点击是劳务,上下文是资产。
这也是为什么“把瀑布图变成上下文”这句话,比它听上去更狠。瀑布图原本只是一排时间条,像车站电子屏上的发车信息。真正值钱的作者、工程师、产品人,看到的却不是“9:03 发车,9:05 到站”,而是“为什么这趟车晚点,它晚点拖累了谁,谁又为了补这个晚点偷偷改了规则”。一旦能这么看,ChromeDevTools 就不再是修 bug 的扳手,而是理解系统的透视镜;chrome-devtools-mcp 也不再是“AI 代替我点网页”,而是“AI 开始拥有现场感”。
现场感这东西,今天非常贵。因为互联网上最廉价的,就是表面;最昂贵的,就是关系。一个圆角按钮很便宜,一条能解释这个按钮为何失效的因果链很贵。一张截图很便宜,一段能说明问题如何发生、为何只在这个用户身上发生、修完后还会不会复发的上下文很贵。我们这些年吃过太多“表面很顺,后台一团麻”的亏,所以才该明白:会点,不算会;会看,才算会。
浏览器前台是舞台,DevTools 掀开的不是幕布,是后台的口供。
往大一点说,这不只是工具升级,也是分工升级。以前人和机器的分界线,常被画在“谁来干活”;以后更像会画在“谁来理解现场”。只会点击的系统,会把人拖回流水线,让人永远替机器收拾误判。能把瀑布图读成上下文的系统,才有资格做人的搭子,因为它开始分担理解,而不只是分担动作。
我看这件事的结论并不温柔:未来最先贬值的,不是不会写代码的人,也不是不会提示词的人,而是那些只会在表面上忙碌的人。页面点得再快,也只是手指勤。能从一堆请求、重定向、报错、缓存和时序里拎出一句准确判断的人,才是真正掌握生产力的人。
说到底,点击像敲门,瀑布图像房屋的水电图。会敲门的人满街都是,能看懂整栋楼哪里漏水、哪根线短路、哪道暗门通向哪间房的人,才配收高价。
真正值钱的不是点击,是把瀑布图变成上下文。
别人聊 AI,我们测 AI——每个结论都能下载原始数据自己复算。 🔗 官网 👉 https://crawdpad.com