CREP:从序列预测调控元件的深度学习工具
基于Enformer微调的CREP模型能直接从DNA序列识别增强子、启动子等顺式调控元件,助力理解非编码区疾病变异。
许多疾病相关的遗传变异位于基因组非编码区域,它们通过扰乱顺式调控元件(如增强子和启动子)发挥作用。现有深度学习模型如Enformer能预测表观基因组信号,但无法直接提供可解释的调控元件注释。近日研究人员提出了CREP,通过对Enformer进行微调,利用REgulamentary数据库的多细胞类型注释,直接预测序列的调控元件身份。在控制实验框架下,CREP显示出更高的预测准确性,为解析非编码变异的功能提供了新工具。该研究以预印本形式发布,尚未经过同行评审。