虎嗅APP@哼唱一段旋律,AI就能创造一种“全新”蛋白质


虎嗅APP@哼唱一段旋律,AI就能创造一种“全新”蛋白质
本文插图
蛋白质在生命中的重要作用不言而喻 , 它是生命的基石 。 而我们机体内合成蛋白质的过程也是相当复杂 , 不仅涉及到氨基酸活化等一系列过程 , 还受体内各种生化物质的调控 。 此外 , 蛋白质复杂的三维折叠结构 , 让想要人工合成蛋白质的科学家们望而却步 。
当地时间 3 月 17 日 , 麻省理工学院科学家们带来了一个新成果 , 他们将蛋白质的复杂结构转化成乐谱 , 随后给予电脑一个种子序列 , 人工智能系统就能设计出一种自然界中从未见过的 “全新” 蛋白质 。
他们发现这个 “全新” 蛋白质不仅具有折叠结构 , 而且比较稳定 。 此外 , 这种 “全新” 蛋白在自然界中从未发现 。 可以说 , 该研究为制造蛋白质提供了一种独特的方法 。 该研究成果发表在 APL Bioengineering中 。
该研究作者 , 麻省理工学院的 Markus J. Buehler 表示 , 这样一种方法为制造全新的生物材料铺平了道路 。 比如人们在自然界中发现了一种蛋白酶 , 就可以通过这种方法改进催化效率或产生新的蛋白变异 。
虎嗅APP@哼唱一段旋律,AI就能创造一种“全新”蛋白质
本文插图
众所周知 , 氨基酸是构成蛋白质的基本单位 , 要想人工制造出蛋白质 , 要么模仿现有的蛋白质 , 要么手工编辑组成蛋白质的氨基酸序列 , 但是这两个过程都十分耗时 , 而且改变氨基酸序列后对整个蛋白质结构和功能会产生什么影响 , 也很难预测 。
“蛋白质一定有它自己的语言 。 ”Buehler 说 。 鉴于此 , 该团队尝试将蛋白质语言翻译成人们更容易理解的另一种形式——音乐 , 与音乐一样 , 蛋白质的结构也是分层的 , 在不同的长度或时间尺度上有不同的结构层次 。
鉴于构成蛋白质的 20 种氨基酸 , 都有一个独特的振动频率(量子化学理论计算) , 因此整个蛋白质的化学结构能够通过音乐理论中的音符、音量、旋律和节奏来描述 。
该团队已于去年 6 月份成功开发出一套可以将蛋白质分子结构转化为声音的系统 , 该研究当时发表在 ACS Nano 杂志 。
该系统能够将自然界 20 种氨基酸转换成 20 个音调的音节 , 也就是说 , 构成任何一种蛋白质的氨基酸序列都能转换成一串音符 。 而蛋白质复杂的结构和功能信息也就编码在一段旋律的音调、音量和持续时间等维度中 。
虎嗅APP@哼唱一段旋律,AI就能创造一种“全新”蛋白质
本文插图
通过音乐来设计由氨基酸组成的蛋白质
然后 , 研究人员使用人工智能系统来研究多种不同蛋白质产生的旋律 , 他们让人工智能系统在音乐序列中引入微小的变化 , 随后将声音翻译回相对应的氨基酸序列 。 在生成蛋白的过程中 , 不同音乐的变化可通过控制温度参数来实现 。
通过这个过程 , 研究人员能够创造现有蛋白质的变体 , 例如基于在自然界最强材料之一的蜘蛛丝中发现的一种蛋白质 , 来制造出不同于任何生物进化产生的更强大的蛋白质 。
而在今天发表的这项研究中 , 研究人员使用蛋白质折叠方式产生的特定声音来训练人工智能系统 , 当系统学会理解折叠蛋白的复杂语言后 , 他们给予系统一个种子序列 , 随后人工智能系统根据这个初始序列推断并设计出一种 “全新” 蛋白 。
那么这个 “全新” 的蛋白是否存在与自然界中 , 是我们认识的已知蛋白质呢?
【虎嗅APP@哼唱一段旋律,AI就能创造一种“全新”蛋白质】该研究团队通过将这个 “全新” 蛋白与所有目前已知蛋白信息的大型数据库进行比较 , 并使用普通模式分析其分子动力学和特征 , 最终证实通过人工智能设计的 “全新” 蛋白在自然界中尚未发现 , 而且这种 “全新” 蛋白质具有稳定的折叠结构 。


推荐阅读