看到护栏能被拆，我先不把安全当底座了

⚠️ 如果你平时只在聊天框里用大模型，最近又想跟新工具，这条别划走。最容易做错的，是把“安全拒答”当成模型天生性格；真按这个判断去选工具，后面很容易把时间和钱花错。

你刷到“某模型又出安全新闻”时，本来想划走，又怕漏掉会改掉下一步判断的那一点。我看到FT那篇Heretic（专门拆模型拒答边界的工具）报道时，才意识到真正该记住的是：大模型安全层，本质上是可拆外壳。[C002] 线索原句：The Financial Times has published an article about Heretic。[C001]

这里说的“护栏”，就是后来加上的拒答边界，不等于底座。News9转述FT与Alice测试：Heretic可去除Meta Llama 3.3护栏，改装后会回答原本拒答的危险提示。[C003]

更关键的是速度。一篇做去护栏实验的Badllama 3论文称，Llama 3 8B在单张显卡上1分钟就能去掉安全微调，70B约30分钟。[C004] 这说明问题不只是“有人在折腾”，而是这层安全常常更像后贴上去的壳。

所以我现在判断一条更新值不值得看，不看它列了多少功能，先看它会不会改掉你下一步的判断。这不是说所有模型都没安全性，而是别把“会拒答”直接当成底座能力。只会用聊天型大模型、最近想跟新工具的人，这条先存着：以后别把安全当默认项。

🤔 你现在选本地模型，会先看总榜，还是先看自己机器的 VRAM？