⚠️ 只会用聊天型大模型、最近又想跟 AI 新工具的人,最容易把这条看偏。我刷到 zai-org / GLM-5 时,本来想划走,又怕自己已经慢半拍。真判断错了,代价不是少看一条新闻,而是接下来把时间、预算和注意力都花在错方向上。[C001]
后来我回去翻文档,才发现 100 万最该盯的不是参数,是接管权。GLM-5.2卖的不是长文本,是代码库接管权。[C002] 说白了,它想替你省掉的,不是“把回答拉长一点”,而是先把一整个旧项目读明白,再动手改。
官方总览(Overview)里,最佳体验直接写成“项目级代码库接管(Project-Level Codebase Takeover)”,还给了“输出系统架构图、模块职责、API 契约、技术债”的审计提示词,以及跨文件长链路重构的任务模板。[C003] 这已经不是聊天框里多塞几段资料的问题了,而是先摸清整仓,再跨文件动刀的问题。
README 中文版(README_zh)也写得很直:GLM-5.2 首次在稳定的 100 万 token(可处理的文本单位)上下文上交付长周期任务能力,并给出 Terminal-Bench 2.1 的 81.0、SWE-bench Pro 的 62.1。[C004] 这些数字不是让你背榜单,是在提醒你,它盯上的活是连续很多步、还要跨文件改。
所以最容易踩的坑,就是把“能装下整个仓库”直接当成“能稳定改好整个仓库”。一条更新值不值得看,不看它列了多少功能,先看它会不会改掉你下一步的判断。接下来如果你要碰旧项目、接别人留下的代码,这条先存;如果你现在只是写作业、润色文案、查资料,先别被 100 万这个数字带着跑。
🤔 你现在最想先避开的,是哪一个坑?