环境化学与生态毒理学国家重点实验室

重点实验室发表机器学习在环境污染中的应用展望论文

发布时间:2022-01-28  |  【打印】 【关闭

  海量环境污染监测及研究数据的积累为人工智能在环境领域的应用提供了前所未有的机遇,环境污染研究中的机器学习已成为领域热门话题。然而,机器学习既不是一个新概念,也不是万能解决方案,任何学习算法均有其自身的局限性。环境化学与生态毒理学国家重点实验室张爱茜、刘倩等分析了这一方法在环境大数据中的独特优势,同时讨论了现有算法的局限性、存在的问题和面临的挑战,为环境工作者正确认识并科学运用机器学习进行污染规律挖掘和趋势预测提供了参考。相关论文以“Data-Driven Machine Learning in Environmental Pollution: Gains and Problems”为题以封面论文发表于Environmental Science & Technology上(Environ. Sci. Technol., DOI: 10.1021/acs.est.1c06157)。

  作者对不同的机器学习算法进行了系统总结和归类,发现在过去10年中,不同环境介质中的机器学习应用论文数量均快速增加,且空气污染研究占比最大。中国和美国发表的相关论文占全球总数的50%以上。此外,分别对大气污染、污水处理、污染源解析、污染暴露健康评估等方面的机器学习应用实例进行了分析。文章指出,随着环境污染的动态性和时空变异性增大,其污染规律的挖掘变得愈加困难,需要复杂的学习算法进行规律解析。在实际应用中,一味依赖先进算法是不可取的,必须高度关注模型选择和内在机制“黑箱化”。每种机器学习算法都有自身数据分布先验假设。在选择算法前,需对数据有一定认识,并在模型准确性与结果的可解释性之间做好权衡。作为一种典型的数据驱动型人工智能方法,再与时俱进的机器学习方法也难以解决数据不足的问题,专业知识和恰当算法的结合加上与之匹配的数据方能构筑环境污染研究的新蓝图。

  论文的第一作者为刘娴博士。本工作得到了国家自然科学基金、国家重点研发计划和中国科学院先导专项培育项目的支持。

  论文链接:https://doi.org/10.1021/acs.est.1c06157

  图1. 机器学习在环境污染研究中的应用领域

  图2. 2011至2020年间机器学习的环境应用研究的领域和国家分布

版权所有 © 环境化学与生态毒理学国家重点实验室 京ICP备05002858号
地址:北京市海淀区双清路18号 邮编:100085
Email:sklece@rcees.ac.cn 技术支持:青云软件