运行这个将使TypeDB返回符合查询条件的数据 。并可以在TypeDB Studio中可视化,如下所示,这将有助于了解哪些相关药物可能值得进一步调查 。
通过自动推理,TypeDB也可以推断出数据库中不存在的知识 。这是通过编写规则来完成的,这些规则构成了TypeDB中模式的一部分 。例如,一个规则可以推断出一个基因和一种疾病之间的关联,如果该基因编码的蛋白质与该疾病有关 。这样的规则将被写成: rule inference-example:when {(encoding-gene: $gene, encoded-protein: $protein) isa encode;(protein: $protein, disease: $disease) isa protein-disease-association;} then {(gene: $gene, disease: $disease) isa gene-disease-association;};然后,如果我们要插入以下数据:
TypeDB将能够推断出基因和疾病之间的联系,即使没有插入到数据库中 。在这种情况下,以下关系基因-疾病-关联将被推断出来 。 match$gene isa gene, has gene-id "2";$disease isa disease, has disease-name $dn; ;(gene: $gene, disease:$disease) isa gene-disease-assocation;通过机器学习加速目标探索有了TypeDB对生物医学数据(符号)进行表示,再加上机器学习的上下文知识就可以让整个系统变得更加强大,从而增强洞察力 。例如,可以通过药物探索管道发现有希望的目标 。
寻找有希望的目标的方法是使用链接预测算法 。TypeDB的规则引擎允许这样的ML模型执行,该模型通过推理推断对事实进行学习 。这意味着从对平面的、无背景的数据学习转向对推理的、有背景的知识学习 。其中一个好处是,根据领域的逻辑规则,预测可以被概括到训练数据的范围之外,并减少所需的训练数据量 。
这样一个药物发现的工作流程如下:
1. 查询TypeDB,创建上下文知识的子图,利用TypeDB的全部表达能力 。
2. 将子图转化为嵌入(embedding),并将这些嵌入到图学习算法中 。
3. 预测结果(例如,作为基因-疾病关联之间的概率分数)可以被插入TypeDB,并用于验证/优先考虑某些目标 。
有了数据库中的这些预测,我们可以提出更高层次的问题,利用这些预测与数据库中更广泛的背景知识 。比如说:什么是最有可能成为黑色素瘤的基因目标,这些基因编码的蛋白质在黑色素细胞中如何表达?
用TypeQL写,这个问题看起来如下: match $gene isa gene, has gene-id $gene-id;$protein isa protein; $cell isa cell, has cell-type "melanocytes";$disease isa disease, has disease-name "melanoma";($gene, $protein) isa encode; ($protein, $cell) isa expression; ($gene, $disease) isa gene-disease-association, has prob $p; get $gene-id; sort desc $p;这个查询的结果将是一个按概率分数排序的基因列表(如图学习者预测的): {$gid "TOPGENE" isa gene-id;}{$gid "BESTGENE" isa gene-id;}{$gid "OTHERTARGET" isa gene-id;}...然后,我们可以进一步研究这些基因,例如通过了解每个基因的生物学背景 。比方说,我们想知道TOPGENE基因编码的蛋白质所处的组织 。我们可以写下面的查询 。 match $gene isa gene, has gene-id $gene-id; $gene-id "TOPGENE"; $protein isa protein;$tissue isa tissue, has name $name;$rel1 ($gene, $protein);$rel2 ($protein, $tissue);在TypeDB Studio中可视化的结果,可以显示这个基因编码的蛋白质在结肠、心脏和肝脏中的表达:

文章插图
结论世界迫切需要创造治疗破坏性疾病的解决方案,希望通过人工智能的创新建立一个更健康的世界,在这个世界中每种疾病都可以被治疗 。人工智能作用于药物探索仍处于起步阶段,但是如果一旦实现将会让生物学释放出新的创新浪潮,并使21世纪真正成为属于它的纪元 。
在这篇文章中,我们看了TypeDB是如何实现生物医学知识的符号化表示,以及如何改善ML来为药物探索做出贡献的 。在药物探索中应用人工智能的科学家们使用TypeDB来分析疾病网络,更好地理解生物医学研究的复杂性,并发现新的和突破性的治疗方式 。译者介绍崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验 。
原文标题:Artificial Intelligence in Drug Discovery,作者:Tomás Sabat
推荐阅读
- 狂飙|《狂飙》中的高启兰,两年不曾演戏,实际年龄看不出
- 肌肤|泡沫丰富绵密,洁净肌肤污垢!是不是你心目中的护肤天花板?
- 香港电影|《狂飙》大嫂美出圈,盘点香港电影中的美艳大嫂!
- 汤盈盈|汤盈盈:港剧中的小三专业户,实现中挤走港姐,成功嫁给钱嘉乐
- 杜甫诗句中花重锦官城中的锦官城是哪里 晓看红湿处花重锦官城是哪里
- 黄俊淇|《外来媳妇本地郎》阿奇扮演者黄俊淇,他才是现实中的康祈祖
- 如何编辑pdf文件中的文字,pdf文件编辑技巧
- 骆驼祥子一起一落是哪几章,《骆驼祥子》中的三起三落各是什么?分别在哪几个章节
- 医药营销专业可以考什么证,医药营销就业前景分析
- 医药营销策略分析,五种常见的医药营销模式
