bioRxiv preprint Score 70

AI蛋白质结构预测并非绝对可靠

最新研究揭示,AlphaFold2等AI工具对非蛋白质序列也可能给出高分结构预测,假阳性率不容忽视。

AlphaFold2等AI蛋白质结构预测工具虽然表现卓越,但其可靠性并非绝对。近日一项预印本研究显示,当输入人工合成的假蛋白质序列时,AlphaFold2仍可能输出高置信度的结构预测,假阳性率约为1/435(基于pLDDT≥70的阈值)。

研究团队利用ColabFold生成了非蛋白质序列,并测试了AlphaFold2对其结构的预测能力。他们发现,即使序列并非真实蛋白质,AI仍有极小概率给出高分结果。这提醒我们,在依赖AI预测进行生物学推断时,需警惕假阳性风险。

此外,研究者还偶然发现某些模型对特定序列存在偏差。该研究尚未经过同行评审,但为AI在结构生物学中的应用敲响了警钟。

AIprotein structureAlphaFold2reliability