中大唯信-唯信计算|JMC | 基于网络的方法在药物研发中的应用( 三 )


人类疾病网络与药物发现
基因调控网络(GRN)、蛋白质-蛋白质相互作用(PPI)网络或代谢网络 , 是构建人类疾病表型-基因型关系基础的细胞机制的系统视图时必不可少的元素 。 通过利用系统生物学方法可以将复杂系统的不同层次结合在一起 。 作为复杂交互组的一个示例 , 在图2中 , 展示了一个从DrugBank数据库中生成的药物-靶标网络(DTN) 。 该网络显示了1636种被批准的小分子药物与1991种人类蛋白质靶标之间的相互作用 。 边代表7521个唯一的相互作用 。 从图中可以明显看出 , 该网络包括一个由3368个节点组成的大型连接组件 , 其中1510个节点是药物分子 。 对此类网络的分析提供了分子药理学领域的全局概况 , 并可能有助于确定药物研究的趋势或未来发展的可能领域 。
中大唯信-唯信计算|JMC | 基于网络的方法在药物研发中的应用
本文插图

药物-靶点网络
图片来源JMC
基于网络的推理
在处理网络时 , 一方面要解决信息丢失的问题 , 这是生物系统研究中的一种常见情况 , 在这种情况下 , 难以获得相互作用的实验证据使网络本质上不完整 , 而另一方面新的数据还在不断增加 。 这个问题在网络理论中是非常基本的 , 从更严格的角度来看 , 推断网络中丢失链接的可能性是对两个尚未连接的节点之间的新链接的预测 , 具有更实际和直接的意义 。
链接预测方法
在实践中 , 一种尝试预测潜在的药物-靶标相互作用(DTI)的方法通常是从诸如社会科学、通信网络、经济和金融等领域借来的 。 这些方法的目标是生成潜在DTI的列表 , 并根据一些预定义的指标对它们进行排名 。 起点是构建异构网络(heterogeneous network) , 在该网络上运行链路预测算法 。 通常 , 异构网络整合了从不同数据库获得的有关药物、靶标和药物-靶标相互作用的可用信息 。
考虑到数据的可用性 , 这些方法的关键步骤是(1)药物-药物和靶标-靶标相似性的计算和(2)药物-靶标关联推论方法的应用 。 对于前者 , 在最初简单地使用指纹和一级序列分别比较药物分子和蛋白质后 , 已发展出更复杂和信息更丰富的相似性指标以便考虑到已知药物-靶标相互作用信息以及蛋白质和网络拓扑信息 。
基于网络的DTI预测方法差异很大 , 通常取决于用户的偏好或专业知识 , 但最受欢迎的算法是从推荐算法或网络传播算法派生而来的 , 它们都属于所谓的基于相似性的算法 。 基于推荐算法的方法旨在预测基于先前计算的相似性分数(也称为协作过滤) , 确定节点对未连接节点的偏好 。 另一方面 , 在网络传播算法的框架内 , 包括了几种方法 , 这些方法通过模拟从种子节点开始的信息在网络中的传播来起作用 。 最著名的是Google页面排名算法 , 该算法使用随机浏览网页来计算其重要性 。
在药物重利用中的应用
作为基于网络的方法可能对药物重利用产生影响的说明性示例 , 在这里 , 我们简要描述一项最近发表的名为研究项目Repethio(https://think-lab.github.io/p/rephetio/)的研究 。 在这项工作中 , 作者报告了构建异构网络以捕获药物和疾病之间的联系的情况(Hetionet版本1.0 , https://neo4j.het.io/browser/)及其在预测新药/疾病的关联中的用途 。 Hetionet整合了来自公共资源的数据 , 由11种类型的约50000个节点与24种类型的约225万条边链接在一起 。
中大唯信-唯信计算|JMC | 基于网络的方法在药物研发中的应用
本文插图

Hetionet 1.0版
图片来源JMC
Repethio项目清楚地解释了基于网络的数据分析如何影响药物研究 , 同时还考虑了将这种方法与功能强大的ML方法进行特征选择和预测相结合的适用性 。 此外 , 这是使用集成到在线平台中的公共数据的示例 , 该数据反过来向用户开放 , 这些用户可以访问该数据并利用其本地时间进行时间和资源密集的组装和集成工作 。 我们设想 , 越来越多的研究数据可用于公共领域 , 这种更频繁的举措得以开发 , 充分利用了大数据和网络科学的综合潜力 。


推荐阅读