HNSW-MS:大规模质谱库的实时精准搜索
新方法利用分层图索引,实现超十亿谱图的实时相似性搜索,为反向代谢组学提供技术支撑。
代谢组学中的质谱相似性搜索是库匹配和分子网络构建的基础,但公共质谱库(如GNPS)规模已超过十亿谱图,传统线性比较方法已难以应对。近日,研究人员开发了HNSW-MS方法,通过分层可导航小世界图索引,实现了大规模谱库的实时精准搜索。该方法特别适用于反向代谢组学范式,即将实验谱图置于所有公共数据中对比,以推动注释和发现。这一进展有望加速代谢物鉴定和生物标志物发现。需要注意的是,该研究目前为预印本,尚未经过同行评审。