可解释机器学习框架助力狗品种推断
新框架利用全基因组SNP数据,准确推断狗品种并分解祖先成分,推动遗传与兽医研究。
超过300种已认品种的家犬是数百年强烈人工选择和反复种群瓶颈的产物。品种标签在遗传和兽医研究中广泛使用,但高维基因型数据、品种间采样不均及混种个体的存在使得基因组推断品种面临挑战。
近日,研究人员提出了一种可解释的机器学习框架,结合降维与多输出随机森林模型,将遗传变异映射至品种的连续表示。该框架可从全基因组SNP数据中高效推断品种标签,并分解祖先成分。在测试中,该方法对纯种和混种犬均表现出较高准确性。
该研究为犬类遗传学和兽医精准医疗提供了新工具。需注意,此论文为预印本,尚未经过同行评审。