⚠️ 平时拿 Claude 聊天、写代码,一看到大新闻就想先判断自己会不会吃亏的人,最容易做错的一步,就是把 Claude 和 Gemini 当成同一种工具去横着比。如果只看宣传,你会以为自己买到的是更强版本,实际却可能先撞到更严格的限制。这类发布最值得看的,常常不是它多强,而是它为什么先把边界收紧。

一句话结论:同Prompt测双模,测的是误配。[C002] 你原本只是来看看模型是不是又变强了,结果真正有戏的,常常是没说出来的那部分取舍。把 Claude 当成同一种工具,以为谁分高谁就适合自己。这个判断本身就先错了。

显性的代价,是你会把一次“提示词没对路”误判成“模型不行”;更隐性的代价,是你会长期把 Claude 用错位置,越用越乱。最会引发讨论的,从来不是模型又强了,而是最强的那个为什么没直接端上来。

针对同一问题, Claude 和 Gemini 的实践对比。[C001] 我后来去看两家的官方文档,差别其实很直接:Claude 官方更偏向通用指令,还建议用 XML 标签,也就是把任务和资料分开包起来的标记,再给 3-5 个示例稳住输出。[C003] Gemini 官方更强调把关键约束先放进系统指令,也就是先把规矩写在最上面,再按“先计划、再执行、再校验”的流程走。[C004]

换句话说,你拿同一把尺子去量,先错在尺子。Claude 更像“先把意图讲清楚,再给几个像样示例”;Gemini 更像“先把规则钉住,再按步骤跑”。这不是一句“谁更强”就能讲完的事。[C003][C004]

想知道这条新闻到底是性能升级,还是一次能力收紧和产品取舍,别先急着看总榜,先看它要求你怎么写提示词。更有用的做法,是同一任务先写两版:一版按 Claude 的习惯写,一版按 Gemini 的习惯写,再看谁更顺手。[C001] 这篇适合转给正在选聊天、写代码、做结构化输出工具的人;只想看一张总榜、懒得改提示词的人,看完大概率还是会白测。把这句转给同场景的人就够了:同Prompt测双模,测的是误配。[C002]

🤔 你现在最想先避开的,是哪一个坑?