2025年3月,理论环境化学课题组傅建捷团队开发了一种基于高分辨率二级质谱的污染物毒性预测方法,相关研究以“From High Resolution Tandem Mass Spectrometry to Pollutant Toxicity AI-Based Prediction: A Case Study of 7 Endocrine Disruptors Endpoints”为题,发表于Environmental Science & Technology期刊。
环境污染物的快速识别与毒性评估是环境科学领域的核心挑战。近十年来,随着软电离技术的发展和高分辨率质谱技术的发展,色谱联合高分辨率质谱技术已成为非靶标分析的有力工具,能够在短时间内灵敏地检测数千种物质。传统非靶标分析依赖于化学结构解析和实验毒理测试,但存在两大瓶颈问题:结构解析效率低——虽然高分辨质谱可检测数千种物质,但结构推断耗时且高成本与毒性数据匮乏——已知化学结构的毒性信息覆盖率不足0.1%,实验毒性测试远滞后于污染物发现速度。因此,如何绕过复杂的结构解析,直接快速的从质谱数据中预测众多结构未知的物质的毒性,成为亟待解决的科学难题。
图1. MSFragTox的工作流程:将质谱分析与毒性预测相结合
图2. 七类毒性终点的子结构特征分析
相较于需根据化合物结构构建分子指纹再进一步预测毒性的传统流程,本研究创新性的通过解析MS/MS碎片概率向量构建了机器学习模型,开发了基于MS/MS质谱数据直接建模的毒性预测框架MSFragTox(图1),突破了传统模型依赖化合物结构信息的局限性。MSFragTox针对Tox21七个内分泌干扰终点,通过毒性相关子结构网络揭示关键碎片与生物学作用的关联(图2),深化了毒性机制认知,模型平均AUROC达0.845。在污水污泥样本质谱数据中实现AR激动剂的高效识别,验证了其真实环境基质中的有效性(图3)。研究进一步开发了在线交互平台(http://ms.envwind.site:8500/),支持用户基于MS/MS数据快速筛查毒性,为直接通过环境样品高分辨质谱谱图解析其组分的毒性优先级排序提供直接支持。
图3. MSFragTox用于污水污泥样品的应用流程
该论文的第一作者为2022级直博生张鑫,2021级硕士生韩肖肖参与方法构建,通讯作者为刘娴副研究员与傅建捷研究员。该工作获得中国科学院战略性先导专项B、国家自然科学基金、中科院青年创新促进会的资助。
论文链接:https://pubs.acs.org/doi/10.1021/acs.est.4c11417