已传文件:photo/1631586161.png
几千年来,越南一直是丰富多样的草药来源,在药物开发中发挥各种目的,以解决健康问题,如癌症。声称化学信息学相关的原理,结构相似的化合物很可能有类似的生物活性,本研究采用分子图卷积,机器学习体系结构从小分子提取特征的作为无向图,预测基于代谢物的结构越南草药的抗癌能力。除了分子图卷积,扩展连接指纹,一种传统的利用分子细节的饱和器(ECFP),以进行性能比较。最后,我们成功地构建了一个基于图卷积的神经网络,具有较高的预测精度,表明该模型在检测抗癌活性方面是可靠的。
图1.从NCI-60数据集建立训练和预测抗癌活性的数据集。
图2.在迭代0时,部分分子的说明。N表示氮原子,被认为是检测原子或核心原子,其标识符为d。C和O分别表示碳,标识符为b的氧原子和标识符为a的氧原子。一行代表单键,双线代表双键。
图3.在迭代0和迭代1时,N个原子的标识符d的说明。每次迭代后,子结构表示在化学结构洞察力方面变得更加丰富。
图4.在图卷积层中的操作说明。C1、C2和C3的阵列表示C原子的特征向量。N原子和O原子分别使用相同的符号。核心原子,氮,被标记为蓝色。为了进行卷积,形成与3个相邻原子相关的核心原子的新特征,这个总和将由一个激活函数进行和包裹。新的特征向量被标记为红色。类似地,同样的过程将应用于分子结构中的所有节点,这将为每个节点产生全新的特征向量。
图5.在两个相邻原子的核心原子上的图卷积层的说明。
我们成功地构建了抗癌活性预测模型,尽管数据集规模小,结果有希望。此外,我们还成功地从NCI-60数据库中抓取微笑数据,并进行过滤,获得最终清理后的数据集,从而取得了良好的性能。在未来,该模型将作为一个独立的版本构建,作为挖掘越南药用植物的工具。基于这项研究,DeepChem不仅有能力发现抗癌候选药物,而且还可以用于对针对其他疾病的潜在候选药物进行图挖掘。
http://n.ustb.edu.cn/https/77726476706e69737468656265737421f4fb0f9d243d265f6c0f/doi/10.1145/3184066.3184090
本信息源自互联网仅供学术交流 ,如有侵权请联系我们立即删除。