bioRxiv preprint Score 70

轻量级CNN分类器高效识别治疗性肽

新模型基于54,655条肽序列训练,通过增强负采样降低假阳性率,加速筛选。

治疗性肽具有高靶标特异性、低毒性和调控蛋白-蛋白相互作用的能力,但实验功能表征成本高且缓慢。现有预测器覆盖功能少、数据集有限且假阳性率高。最新研究提出一个轻量级CNN分类器,在包含54,655条肽序列、10个功能类别的最大治疗性肽数据库上训练,通过增强负采样显著降低假阳性率。该模型可直接从序列预测功能,加速筛选和生成设计。需要指出,该研究为预印本,未经同行评审。

therapeutic peptidescomputational biologymachine learning