您当前的位置: 首页 > >  新闻动态 > >  正文

我中心1篇论文被权威期刊Research录用

发布时间:2026-04-29   点击数:

近日,我中心刘昆宏教授团队联合军事科学院军事医学研究院伯晓晨研究员团队,提出一种全新的多任务级联森林框架,实现跨物种急性毒性的精准预测。相关成果以“Multi-Task Cascade Forest Framework for Predicting Acute Toxicity across Species”为题发表在 Research 期刊上。论文由我中心刘昆宏教授,军事医学研究院李睿江博士、武连莲博士、杨军博士、韩俊珊博士、何松副研究员、伯晓晨研究员,以及福建医科大学高捷博士合作完成。

多物种急性毒性预测(Multi-Species Acute Toxicity Prediction, MSATP)是毒性评估中一个关键且极具挑战性的任务。机器学习作为一种快速、精确、低成本的可替代方法应运而生,它为减少对动物实验的依赖提供了有效的解决方案。当前MSATP上的研究大都使用多任务深度神经网络进行建模,然而很多子任务(毒性终点)的特点是表格型、小尺寸、高维度且特征稀疏,经常造成网络模型在不同子任务上的泛化能力不足。为了处理这个问题,本研究提出一种全新的多任务级联森林框架,它整合了基于知识迁移的特征增强策略、以及基于协方差度量和贪心检索的样本增强策略,适用于不同尺寸的子任务学习(图1)。

1 多任务级联森林框架的技术路线图

对比于目前该领域最先进的神经网络方法,提出的框架在59个毒性终点上的平均预测性能实现了12%的提升。图2展示提出的框架和现有神经网络方法在59个毒性终点上的性能比较,曲线和条形分别代表所提框架和7个对比方法的回归性能。

2 多任务级联森林框架的性能展示

此外,在化合物的单视图语境下本研究执行了模型消融实验来验证不同增强策略的有效性,同时引入多个外部数据集评估所提框架在未知物种上的泛化能力。在多视图语境下,特征融合策略和共识集成策略被证实可以进一步提升所提框架的性能。最后,本研究通过比较不同毒性终点上的特征重要性向量,为不同物种间的毒性相关性提供了可解释的见解。

总体而言,本研究有效地解决了神经网络在MSATP上泛化能力不足的缺陷,并在各种毒性预测领域展现出巨大的应用潜力。所提框架主要依赖特征增强和样本增强提升模型在不同毒性终点上的预测能力。前者借鉴了级联森林中类概率向量的拼接,但其他研究指出使用更复杂的表达有助于进一步提升特征表示,例如基于沙普利的特征增强或基于树嵌入的特征增强。后者以矩阵间的协方差距离作为指导,通过贪心近邻方法检索近距离的毒性终点,但该策略忽视了远距离终点中的关联样本,在后续研究中多任务聚类方法或许可以作为有效的手段来解决这个瓶颈。

论文的数据与代码网址为:https://github.com/MLDMXM2017/CFF-AT

Research 是中国科学技术协会与美国科学促进会于2018年共同创办的国际化高水平综合性大型开放获取(OA)科技期刊,作为《Science》自1880年创刊以来的第一本合作期刊,定位为世界一流水平,对标《Science》和《Nature》。期刊聚焦人工智能、先进能源、先进制造、生命科学等跨学科热点领域,主编(中国)为中国科协副主席、中国科学院院士包为民,期刊2025SCI影响因子为10.7,位列中科院综合类期刊1TOP刊。



厦门大学 厦门大学信息科学学院 厦门大学软件工程系 厦门大学信息科学系