蛋白质大语言模型助力跨物种单细胞整合
新方法利用蛋白质大语言模型优化基因同源映射,提升单细胞转录组跨物种整合的准确性。
跨物种单细胞转录组整合需要建立基因对应关系。现存方法多依赖Ensembl同源表,其多对多映射常放大基因家族效应,产生虚假微簇。严格的一对一映射虽能减少假象,但损失约900对同源基因。新研究开发基于蛋白质大语言模型(pLLM)的映射策略,在保持一对一映射的同时恢复丢失的基因对,提升了整合质量。
新方法利用蛋白质大语言模型优化基因同源映射,提升单细胞转录组跨物种整合的准确性。
跨物种单细胞转录组整合需要建立基因对应关系。现存方法多依赖Ensembl同源表,其多对多映射常放大基因家族效应,产生虚假微簇。严格的一对一映射虽能减少假象,但损失约900对同源基因。新研究开发基于蛋白质大语言模型(pLLM)的映射策略,在保持一对一映射的同时恢复丢失的基因对,提升了整合质量。