购物车 0 注 册   |   登 录

mxene 学术专题

 
联系我们

咨询热线:

17715390137

18101240246

18914047343

邮件:mxenes@163.com

扫码关注或微信搜索公众号:

二维材料Fronrier
关注后点击右下角联系我们,

进入企业微信。

专业服务在线

mxene 学术专题
您的位置: 首页 > mxene 学术专题 > mxene 其他领域

Advanced Drug Delivery Reviews | 小数据,大挑战:机器学习与深度学习策略用于数据有限的药物发现

文章来源:北科纳米专业的纳米材料合成专家 浏览次数:125时间:2026-02-26 设计合成:18101240246

限制机器学习(ML)和深度学习(DL)模型在药物发现与开发(DDD)流程中潜力的关键瓶颈是高质量实验数据的稀缺。有限的数据并非异常,而是 DDD 过程的固有特征。巨大的财务成本、时间和保密性问题限制了可用数据集的规模。直接将标准机器学习和深度学习算法应用于这些小数据集存在重大挑战。传统机器学习模型仍受限于依赖手工制作特征和捕捉复杂生物关系的能力。相比之下,假设数据丰富的 DL 算法在训练小数据集时容易出现过拟合和推广性差。因此,小数据问题代表了一个根本性的约束,决定了 DDD 中 AI 应用的实用性和可信度。尽管此前综述已全面调查了人工智能和机器学习在药物发现领域的广泛格局,但在 DDD 流程中存在着关于小数据挑战的重大空白。应对这一挑战需要调整通常假设数据丰富的数字学习方法,同时扩展传统机器学习方法,这些方法虽适合小数据,但其表示能力有限。本综述通过调查关键药物发现任务,强调有限数据的普遍性,并综合了传统机器学习方法和针对这些情境量身定制的高级 DL 策略,弥补了这一空白。通过将方法学进展与任务特定应用相结合,综述概述了当前的方法,并识别了推动稳健、可解释且可推广的人工智能在药物发现中的机遇。

该研究以题为“Small data, big challenges: Machine- and deep-learning strategies for data-limited drug discovery”发表在Advanced Drug Delivery Reviews上。


总结

药物研发长期面临高质量数据稀缺的挑战,这严重制约了机器学习与深度学习的应用潜力。在数据有限的情况下,传统机器学习方法展现出不可替代的价值。例如支持向量机(SVM)、随机森林(RF)等方法,凭借其对小样本的稳健性、模型可解释性以及计算高效的特点,在生物标志物发现、靶点识别、初步活性筛选和毒性预测等关键任务中仍是首选工具。然而,这些模型依赖于人工特征工程,难以从原始复杂的生物数据中自动学习深层次模式,在处理高维、非线性的分子与组学数据时存在固有瓶颈。


为突破数据瓶颈,深度学习领域发展出一系列创新适应策略。迁移学习利用大规模无标签数据预训练模型,再针对小样本任务微调,有效传递知识;自监督学习通过设计 pretext 任务从数据自身生成监督信号;元学习和少样本学习使模型能快速从极少数样本中泛化;数据增强和轻量化混合模型则提升了小数据下的鲁棒性和泛化能力。这些技术已成功应用于虚拟筛选、药物-靶点相互作用预测、ADMET 性质优化及药物重定位等环节。未来,推动领域发展的关键将在于建立标准化的小数据基准、构建可解释的混合建模框架,并将生物网络、通路等先验知识系统融入模型,最终推动可靠、透明且合规的AI工具走向临床转化。


参考文献:

DOI: 10.1016/j.addr.2025.115762





       北科纳米-学术前沿公众号
二维材料Frontier 生物纳米材料前沿 MXenes Frontier 纳米医学Frontier

 

温馨提示:北京北科新材科技有限供应产品仅用于科研,不能用于人体。部分网站示意图源自互联网,图片仅供参考,请以实际测试结果为准,如有侵权请联系我们立即删除。产品参数仅供参考,请以实际值为准!
版权所有 © 2019 北京北科新材科技有限公司
All rights reserved. 京ICP备16054715号-2
纳米合成
18101240246
电话咨询
17715390137
扫一扫

扫一扫