只会用聊天型大模型、最近开始想跟进 AI 新工具的人,刷到 K-Dense-AI / scientific-agent-skills 这类项目,最容易做错的判断,就是先盯模型强不强。你刚刷到这条消息,本来准备顺手划走,但又怕自己错过了真正会影响下一步判断的那一点。这里更值钱的结论不是“又多了 135 个技能”,而是:科研Agent,也就是替人按步骤做研究任务的 AI 帮手,先缺SOP,不缺模型。

这一步看偏,代价不只是多看一条新闻。如果只盯表面热闹,你很容易在错误方向上花掉时间、预算和注意力。更隐性的代价,是你会一直围着功能列表转,却看不到它真正改变的是哪一步:它不是先给模型加神力,而是先把重复研究任务写成一份能照着走的步骤说明。SOP,你可以先把它理解成一套写清顺序的任务做法。

公开材料里,K-Dense 自己把问题说得很直:模型有智能,但缺程序性知识和组织上下文,Skill 补的是 AI 科研最后一公里。[S002] Agent Skills 官方页讲的也是同一个缺口:Agent 变强了,不等于它能稳定把真实工作做完,缺的常常还是上下文和流程知识。[S003] 再看仓库页,scientific-agent-skills 列的是 135 个现成任务指南,覆盖生物、化学、健康和地理等任务。[S001] 这三点放在一起,结论就更像是在说:K-Dense卖的不是“135 个功能”,而是“把步骤写清楚”这件事。

边界也要说清:上面这些判断基于截至 2026 年 5 月的公开页面和产品文档,是来源复核,不是实验室实测。它能帮你校正判断,不能替代亲手测试。

所以一条更新值不值得看,不看它列了多少功能,先看它会不会改掉你下一步的判断。对普通人来说,下一步不是急着换一个更强的模型,而是先回头看自己手上有没有一段总在重复做的流程,能不能被写成这样的任务说明。也别把这句理解成“模型没用”;更准确的边界是,按公开材料的说法,眼下先卡住科研Agent的,是缺那份能落地的步骤和上下文。[S002][S003] 身边若有人也在把这类项目当“又一个更强模型”的消息看,把这条转给他。