IBD机器学习分类器性能因训练数据而异
研究揭示炎症性肠病诊断模型的泛化能力受训练数据集组成影响,而非地理多样性。
一项针对炎症性肠病(IBD)微生物组诊断模型的研究发现,机器学习分类器的性能主要取决于训练数据集的组成,而非地理多样性。研究人员汇总了来自不同地区的七个公开数据集,训练多种分类器并在独立数据上评估。结果显示,即使控制地理因素,不同来源的训练数据导致模型在外部测试中表现差异显著。该预印本尚未经同行评审。
研究揭示炎症性肠病诊断模型的泛化能力受训练数据集组成影响,而非地理多样性。
一项针对炎症性肠病(IBD)微生物组诊断模型的研究发现,机器学习分类器的性能主要取决于训练数据集的组成,而非地理多样性。研究人员汇总了来自不同地区的七个公开数据集,训练多种分类器并在独立数据上评估。结果显示,即使控制地理因素,不同来源的训练数据导致模型在外部测试中表现差异显著。该预印本尚未经同行评审。