科学用超算给材料测“基因”


近年来 , 材料应用领域的发展在世界范围内获得广泛关注 。 关键材料供应多样化、开发关键材料的替代材料等课题成为各国在科研领域发力的焦点 , 保障关键材料安全和可靠供应成为这些关注背后的核心考量 。
材料是现代工业的基础 。 而在我国 , 材料供应形势分外严峻 。 中科院院士、中科院物理研究所极端条件物理重点实验室主任汪卫华曾在接受《中国科学报》采访时表示 , 我国很多关键材料自给程度有待提升 , 因此希望通过先进的理念来推动材料应用的发展及产业化 。
正是基于这一思考 , 汪卫华领导的实验室 , 正在北京怀柔科学城构建一个“材料基因工程平台” 。
材料研究也有基因工程?这要从“材料基因组计划”说起 。
【科学用超算给材料测“基因”】国内外竞逐“材料基因组计划”
2011年 , 美国率先提出旨在缩短新材料的研发周期和成本的“材料基因组计划”(MGI) 。 该计划被称为美国继曼哈顿计划、阿波罗计划、人类基因组计划之后的第四大重大科研计划 。
材料基因组是一个象征义的提法:就像人类的基因组一样 , 材料中原子的性质和排列 , 乃至晶体结构和缺陷都将决定材料的内在性能 。 而“材料基因组技术”就是通过高通量实验装置 , 对组合材料的样品单元进行高通量表征 , 并将所获得的材料性能数据储存在数据库中;进而 , 再通过数据挖掘等技术得到材料“成分—结构—性能”的构效映射关系 。
通过分析、解构材料“基因组” , 可以改变传统材料研究方法 , 加速材料研发进程 。
“在材料基因组计划中 , 数据库及其共享、计算工具开发至关重要 。 ”某上市公司的材料研发高级工程师刘国涛告诉《中国科学报》 。
作为怀柔科学城配套跨学科交叉研究平台中重大科研项目之一 , “材料基因工程平台”的目标就是建成大规模、手段先进的材料基因组研究平台 。
“材料基因组平台包括大数据 , 高通量计算、人工智能部分 。 ”据汪卫华介绍 , 通过高通量计算、机器学习等人工智能方法缩小和锁定希望要找的材料范围 , 然后再采用高通量制备和检测快速筛选材料 , 这样可以大大节约材料研发成本和周期 , 进而在关键材料领域取得重要突破 。
从这个意义上来讲 , 材料基因工程堪称是“中国版的材料基因组计划” 。
科学用超算给材料测“基因”
本文插图
材料基因组研究平台项目概览(效果图)
超算做帮手
中科院物理研究所研究员刘淼 , 就是专门借助高性能计算等设备 , 开展材料基因工程研究的科学家 。 在他看来 , 超算设备对于材料科学意义重大 。
“材料计算的需求是很大的 。 ”近日在由英特尔公司发起的一场媒体专访中 , 刘淼告诉《中国科学报》 , 国外的一些顶级超算设备 , 很多业务就是在做材料科学的计算 。 比如美国橡树岭国家实验室、劳伦斯伯克利实验室、美国国家能源研究科学计算中心的超算设备 , “至少1/6以上的机时是用在材料相关领域的” 。
在怀柔科学城 , 材料基因工程平台也配备了专门的超算装备 。 在由戴尔提供的高性能计算集群上 , 该平台拥有160个计算节点和1个GPU节点 , 同时配置有英特尔OPA 100Gbps交换机和接近2PB的存储系统 。 与此同时 , 中科院物理研究所还设置了“材料基因数据集群处理平台” , 包括一个小型的私有云系统 。
“我们希望减少重复开发 , 因此需要代码效率比较高 , 需要用到一些NoSQL的数据库来进行开发 。 这其中 , 底层计算会大量用到英特尔相关的并行计算能力 , 比如MPI , 以及一些数学的函数库 , 这些对我们帮助非常大 。 ”刘淼说道 。
有了超算等硬件支撑 , 刘淼表示“希望挖掘蕴含在计算数据中的一些知识” 。 他举例说 , 比如通过强大算力 , 短时间内算出几百上千材料的结构信息、热力学稳定性、电子结构信息等 , 再以这样的材料数据流形成的数据储备为基础 , 向来自物理、化学、材料等领域的科学工作者提供检索和查询支撑 。


推荐阅读