bioRxiv preprint Score 75

链感知语言模型预测抗体亲和力

新模型通过区分抗体重链和轻链,无需结构信息即可精准预测抗体-抗原结合强度。

亲和力是决定抗体能否成为候选药物的关键,但实验测量成本高昂。现有序列模型常将重链和轻链混合处理,丢失了链特异性信号。新开发的链感知蛋白语言模型(Chain-aware PLM)将抗体重链、轻链和抗原序列分别编码,通过注意力机制捕获链间及表位交互。在三个公开数据集上,该模型在Pearson相关系数上比现有最优序列方法提升约0.19,接近部分结构预测器的性能。特别在缺乏复合物结构的早期发现阶段,该模型能有效对抗体-抗原对进行排序。团队强调,该研究为预印本,尚未经同行评审,但为高通量抗体筛选提供了新工具。

antibodyaffinity predictionprotein language modelbioinformatics