bioRxiv preprint Score 65

单突变频率谱:破解罕见等位基因突变复发难题

提出单突变频率谱方法,通过卷积模型解析罕见等位基因中反复突变对频率谱的影响。

随着全基因组和全外显子组数据规模日益庞大,研究人员能够检测到种群中频率极低的等位基因。然而,这些罕见等位基因中常存在反复突变——即衍生等位基因状态相同但并非来自同一祖先,导致传统的位点频率谱(SFS)分析严重依赖于突变率,变得困难重重。

为攻克这一难题,研究团队定义了单突变频率谱(SMFS),即来自单一突变事件的后裔等位基因的频率分布。他们发现,包含反复突变的SFS可以表示为SMFS卷积的加权和。这一简洁而强大的数学框架,使得群体遗传学研究者能够更准确地解析低频变异数据。

该研究为分析大规模基因组数据中的稀有变异提供了一种新工具,有助于更深入地理解种群历史和突变过程。值得注意的是,该论文为预印本,尚未经过同行评审。

population geneticsrare allelesmutationbioinformatics