超级计算机他们搬动了百万行代码“大山”( 二 )


大伙儿这么拼 , 还有一个原因 , 那就是怕浪费钱 。 超级计算机用电量大 , “神威·太湖之光”运行一天 , 电费就要20万元左右 。 “我们通宵调试和运行程序 , 这样机器的利用率才能最大化 。 ”刘钊说 。
经过一个个灯火通明的夜晚 , 时间走到了2016年11月17日 。 这一天 , 在美国盐湖城 , 一年一度的“戈登·贝尔奖”正在揭晓 。
基于“神威·太湖之光”的“千万核可扩展全球大气动力学全隐式模拟”应用项目获奖!这个项目是由中科院软件所等单位与国家超级计算无锡中心合作完成的 。 项目名称被念出来后 , 付昊桓淡定地从座位上站了起来 。
这是中国超算应用团队近30年来首次获得“戈登·贝尔奖” 。 有评论指出 , 这次“零的突破”标志着中国科研人员正将超算的速度优势转化为应用优势 。
1年后 , 由付昊桓团队完成的“非线性地震模拟”应用再次斩获“戈登·贝尔奖” , 实现了中国超算应用在此项大奖上的蝉联 。
有一组数字同样令人振奋 。 2016年 , 全球有6个项目获“戈登·贝尔奖”提名 , 其中基于“神威·太湖之光”的应用占3个 , 占据半壁江山 。 2017年 , 有3个项目获提名 , 其中基于“神威·太湖之光”的应用占2个 , 占比达到了2/3 。
“戈登·贝尔”奖项评审委员会主席曾这样表示 , “我们很惊讶你们有这种毅力 , 把这样一座‘大山’搬了过来 。 ”“大山”指的是百万行代码 , 付昊桓团队为什么要“搬”这百万行代码?
冲破封锁——
核心部件全部国产化
30多年前 , 摆在中国超算用户面前的是一个神秘的“玻璃房”:美国人把一台超级计算机卖给中国 , 用不透明的玻璃包裹得严严实实 , 中国技术人员未获授权不得入内 。
“以今天的眼光来看 , 那个所谓的超级计算机 , 充其量只是一台高性能电脑 。 但对当时的中国来说 , 却是一个难以企及的高峰 。 ”国家超级计算无锡中心主任杨广文说 。
上世纪末 , 中国迈入独立设计和制造超级计算机的国家之列 , 但在核心处理器等关键部件与技术方面受制于人 。
步入“十二五” , 在国家“863”项目重点支持下 , 中国超级计算机发展不断取得突破 。 在“全球超级计算机500强”榜单上 , “中国制造”的身影越来越多 。 内置英特尔芯片的“天河二号”异军突起 , 成为世界上第一台实现“全球超级计算机500强”六连冠的超级计算机 。
然而 , 2015年4月 , 美国政府宣布 , 把与超级计算机相关的4家中国机构列入限制出口名单 , 这直接导致“天河二号”无法如期完成攻关目标 。
每次技术封锁带来的都是自力更生 。 经过大力研发 , 2015年底 , 国家并行计算机工程技术研究中心成功研制出“神威·太湖之光” , 它首次采用国产核心处理器“申威26010” , 实现了所有核心部件的国产化 。 随后 , “神威·太湖之光”在无锡安装运行 。
只有5厘米见方的薄块“申威26010”成为中国打破技术封锁的一柄利器 。 25平方厘米的方寸之间 , 集成了260个运算核心、数十亿晶体管 , 达到了每秒3万多亿次计算能力 。
从此 , 中国在高性能计算及应用领域拥有了更强的话语权 。 今年6月发布的“全球超级计算机500强”榜单中 , 中国的超级计算机占据226席 , 数量继续位列全球第一 。
硬件诞生了 , 软件开发就成了下一个挑战 。 “神威·太湖之光”采用的是全国产的新型片上融合异构芯片 , 原有基于国外x86架构设计的大量科学及工程计算软件 , 无法直接在“神威·太湖之光”上高效运行 。
在进行“全球气候模式的高性能模拟”研究时 , 甘霖就要面对这个挑战 。 他是付昊桓在清华大学带的第一个博士生 , 还是国家超级计算无锡中心主任助理 。
甘霖说 , 一般的应用也就几千到几万行代码 , 而地球系统模式代码近百万行 。 这些是各国气候学家在过去几十年里积累的对大气、海洋、陆面等各个圈层变化机制的理解 , 每个人写代码的风格不同 。 为此 , 他们需要逐条进行代码的转换、移植乃至重新设计 , 最后才能为“神威·太湖之光”所用 , 这是个“愚公移山”的过程 。


推荐阅读