⚠️ 如果你只会用聊天型大模型,最近又开始看各种人工智能新工具,这条最容易看错。你刚刷到英伟达的 SkillSpector(NVIDIA / SkillSpector,一个检查技能说明、权限和数据流是不是对不对得上的工具)[C001],第一反应多半是:哦,又一个查木马的。真要这样理解,后面赔掉的往往不是 10 分钟,而是时间、预算和注意力都花错地方。
我后来才看明白,它真正提醒我的只有一句:智能体安全(Agent 安全)先审意图,再审代码。换成原话就是:Agent安全先审意图,再审代码[C002]。一条更新值不值得看,不看它列了多少功能,先看它会不会改掉你下一步的判断。
论文里最反常识的一组数字是:在 67,453 个技能样本里,它对可疑样本的命中是 75.3%,对明确恶意样本的命中只有 6.8%[C003]。这组数字说明,它盯的重点不是“毒不毒”,而是“说明写得像没事,权限和行为会不会越界”。
这和普通人有关,因为很多人现在装技能、接插件、开自动化,先看的都是“能不能提效”,很少先看它会不会顺手多拿权限、把内容往外送。风险就不只是代码里有没有坏东西,而是说明、权限和数据流向到底对不对得上。报告也提到,很多新型攻击不是传统代码扫描或恶意软件扫描能识别的,得把提示词、代码和配置一起看[C004]。
所以这条建议先存。现在还只把大模型当聊天框的人,不用硬跟;等你开始连文件、连网页、连账号,再回来看。等你真要把工具接进自己的流程,这个判断比追新功能更值钱:先看它要什么权限。
🤔 你现在最想先避开的,是哪一个坑?