化学信息学预测藻蓝蛋白稳定剂
利用机器学习模型预测酸性环境下藻蓝蛋白的稳定剂,准确率高达88%。
藻蓝蛋白是功能性饮料中主要的天然蓝色色素,但在酸性条件下(pH≈3)会迅速褪色和聚集。传统实验筛选稳定剂成本高且难以组合。本研究开发了一个化学信息学框架,通过三轮筛选数据(49种化合物,8%命中率)训练LightGBM分类器,利用10个RDKit描述符和11个专家特征,达到了0.88的留一法AUC,优于基于电荷密度的单特征基线(AUC 0.75)。SHAP分析显示多磷酸盐身份是稳定效果的关键预测因子。需注意该研究为预印本,尚未经过同行评审。