科研Agent先缺SOP，不缺模型

只会用聊天型大模型、最近开始想跟进 AI 新工具的人，刷到 K-Dense-AI / scientific-agent-skills 这类项目，最容易做错的判断，就是先盯模型强不强。你刚刷到这条消息，本来准备顺手划走，但又怕自己错过了真正会影响下一步判断的那一点。这里更值钱的结论不是“又多了 135 个技能”，而是：科研Agent，也就是替人按步骤做研究任务的 AI 帮手，先缺SOP，不缺模型。

这一步看偏，代价不只是多看一条新闻。如果只盯表面热闹，你很容易在错误方向上花掉时间、预算和注意力。更隐性的代价，是你会一直围着功能列表转，却看不到它真正改变的是哪一步：它不是先给模型加神力，而是先把重复研究任务写成一份能照着走的步骤说明。SOP，你可以先把它理解成一套写清顺序的任务做法。

公开材料里，K-Dense 自己把问题说得很直：模型有智能，但缺程序性知识和组织上下文，Skill 补的是 AI 科研最后一公里。[S002] Agent Skills 官方页讲的也是同一个缺口：Agent 变强了，不等于它能稳定把真实工作做完，缺的常常还是上下文和流程知识。[S003] 再看仓库页，scientific-agent-skills 列的是 135 个现成任务指南，覆盖生物、化学、健康和地理等任务。[S001] 这三点放在一起，结论就更像是在说：K-Dense卖的不是“135 个功能”，而是“把步骤写清楚”这件事。

边界也要说清：上面这些判断基于截至 2026 年 5 月的公开页面和产品文档，是来源复核，不是实验室实测。它能帮你校正判断，不能替代亲手测试。

所以一条更新值不值得看，不看它列了多少功能，先看它会不会改掉你下一步的判断。对普通人来说，下一步不是急着换一个更强的模型，而是先回头看自己手上有没有一段总在重复做的流程，能不能被写成这样的任务说明。也别把这句理解成“模型没用”；更准确的边界是，按公开材料的说法，眼下先卡住科研Agent的，是缺那份能落地的步骤和上下文。[S002][S003] 身边若有人也在把这类项目当“又一个更强模型”的消息看，把这条转给他。