bioRxiv preprint 2026-05-22 Score 70

IBD机器学习分类器性能因训练数据而异

研究揭示炎症性肠病诊断模型的泛化能力受训练数据集组成影响，而非地理多样性。

一项针对炎症性肠病（IBD）微生物组诊断模型的研究发现，机器学习分类器的性能主要取决于训练数据集的组成，而非地理多样性。研究人员汇总了来自不同地区的七个公开数据集，训练多种分类器并在独立数据上评估。结果显示，即使控制地理因素，不同来源的训练数据导致模型在外部测试中表现差异显著。该预印本尚未经同行评审。

IBDmicrobiomemachine learning

原文来源： https://doi.org/10.64898/2026.05.21.727052