别再吹AI读基因，先看病历有没有整理成标准症状词

⚠️ 这条是写给平时只会用聊天型大模型、最近又怕跟不上AI新工具的人看的。你刚刷到一条英文消息，标题大意是“人工智能帮医生诊断儿童罕见遗传病”（Using AI to help physicians diagnose rare genetic diseases affecting children）。[C001] 你本来想划走，又怕自己落后；最容易做错的判断，就是立刻把注意力放到“AI是不是更会读基因了”。

我原来也是这么想的，后来才发现，儿科罕见病AI第一战场不是基因，是病历结构化。[C002] 白话说，就是先把病历里零散的异常表现，整理成机器能比对的标准症状词。前面这一步没做好，后面再强的基因排序，也可能只是把时间和钱花在岔路上。

证据里最值钱的不是“模型更大”，而是它先补前处理。RARE-PHENIX这套流程不是上来就硬读基因，而是先从临床记录里提特征，再标准化到HPO（统一症状词表），最后再做排序。它用2671名UDN患者训练，又拿16357份真实病历做外部验证，最后这个“症状整理得像不像”的分数做到0.70，高于PhenoBERT的0.58。[C003]

我又回头看另一篇材料，才明白为什么这一步会卡这么久。很多人以为病历都在电脑里，机器顺手就能吃；但在医学术语库UMLS里，ICD这类病种编码只有2.2%能直接对应到HPO，到了真实电子病历里，不到50%的编码能对上，而且越罕见越容易漏。[C004] 所以后面再吹“基因读得更准”，如果前面的症状没先整理干净，方向还是会跑偏。

一条更新值不值得看，不看它列了多少功能，先看它会不会改掉你下一步的判断。这条我会先存着：它更适合想判断医疗AI该不该继续跟的普通人，也适合转给正在漫长求诊里的人；不太适合拿它直接选具体工具，或者替医生拍板。下次再刷到这类消息，先别问模型多强，先问病历有没有先整理成标准症状词。

🤔 你现在最想先避开的，是哪一个坑？