|229页CMU博士张昊毕业论文公布，探索机器学习并行化的奥秘

机器之心报道
机器之心编辑部
CMU 机器人研究所张昊（Hao Zhang）博士论文新鲜出炉，主要围绕着机器学习并行化的自适应、可组合与自动化问题展开。
随着近年来，机器学习领域的创新不断加速， SysML 的研究者已经创建了在多个设备或计算节点上并行机器学习训练的算法和系统。机器学习模型在结构上变得越来越复杂，许多系统都试图提供全面的性能。尤其是，机器学习扩展通常会低估从一个适当的分布策略映射到模型所需要的知识与时间。此外，将并行训练系统应用于复杂模型更是增加了非常规的开发成本，且性能通常低于预期。
近日， CMU 机器人研究所博士张昊公布了自己的博士学位论文《机器学习并行化的自适应、可组合与自动化》，旨在找出并解决并行 ML 技术和系统实现在可用性和性能方面的研究挑战。
具体而言，该论文从可编程性、并行化表示、性能优化、系统架构和自动并行化技术等几方面对分布式并行 ML 展开了研究，并认为分布式并行机器学习可以同时实现简洁性和高效性。此外，该论文表明，并行 ML 的性能可以通过生成自适应 ML 模型结构和集群资源范式的策略实现大幅度提升，同时通过将「如何并行化」这一核心问题形式化为端到端优化目标以及构建可组合分布式 ML 系统来自动优化这类自适应、自定义策略，进而可以解决可用性挑战。

本文插图

论文链接：https://www.cs.cmu.edu/~hzhang2/files/hao_zhang_doctoral_dissertation.pdf
机器之心对该论文的核心内容进行了简要介绍，感兴趣的读者可以阅读原论文。
论文内容介绍
这篇论文主要由三部分组成，如下图所示，第 1 部分（第三章 - 第五章）：在单个机器学习并行化层面，使用自适应并行化理解和优化并行机器学习性能；第 2 部分（第六章 - 第七章）：为机器学习并行开发统一的表示和可组合系统；第 3 部分（第八章）：机器学习并行化的自动化。

本文插图

论文结构概览
论文第一部分提出了一个简单的设计原则自适应并行（adaptive parallelism），根据模型构建要素（比如层）的特定 ML 属性，将合适的并行化技术应用于模型组成要素中。作者以 BERT 为例，总结出了实现这种自适应的基本原理和三个核心概念，分别是子模型策略组合、多个并行化方面的系统优化和资源感知。此外，作者推导出了一系列优化和实现方法，从不同层面去提升 ML 并行化。研究结果表明其显著提高了 ML 训练在集群上的效率和可扩展性。
第二部分对这种方法进行了概述，并且面向机器学习并行化任务的两个常见范式：单节点动态批处理和分布式机器学习并行，作者将机器学习的并行化表述为端到端的优化问题，并寻找其自动化的解决方法。作者提出了原则表征来表示两类机器学习并行，以及可组合的系统架构 Cavs 与 AutoDist 。它们能够快速组合不可见模型的并行化策略，提升并行化表现，并简化并行机器学习程序。

本文插图

Facebook AI 提出的 DETR 的架构图
在此基础上，论文第三部分提出一个自动并行化框架 AutoSync ，用于自动优化数据并行分布训练中的同步策略。它实现了「开箱即用」的高性能，可以通过提出的表征进行空间导航，并自动识别同步策略，这些策略比现有的手工优化系统的速度提高了 1.2-1.6 倍，降低了分布式 ML 的技术障碍，并帮助更大范围的用户访问它。总结来说，这篇论文提出的相关技术和系统验证了分布式环境下面向大规模机器学习训练的端到端编译系统的概念与原型实现。

|229页CMU博士张昊毕业论文公布，探索机器学习并行化的奥秘

推荐阅读

省心省力又省钱，解放J6P自动挡牵引车为啥这么受欢迎？

小柒厨房菜■村厨猪手、肉丝南瓜花、菜心炒鱼片这几道家常菜的做法

淘宝直播、问大家、猜你喜欢，95后最爱的淘宝三大功能

孔夫子搬家一一歇后语下一句孔夫子搬家一一歇后语

时间■再过4个月时间，新农合账户将会清零了，很多农民不懂怎么

历史神秘事|尽管武功谋略皆为一流，为何最终落得郁郁而终的下场呢，马超

如何正确引导孩子交朋友，如何正确引导孩子交朋友初中

鹿晗零点为关晓彤庆生|【围观吃瓜】鹿晗零点为关晓彤庆生，有点甜是怎么回事哦！

土木女生国内设计院or造价还是出国读研，大二下迷茫求指点。?

牛仔裤|水利部：水旱灾害防御应急响应提升至Ⅱ级！

全创优咖|3星座欣喜，终于获得心上人认可，牵手相伴到永生，在7月

腿比较细，但是上半身很胖，脖子粗，脸比较胖，怎么样做或者说合理的锻炼才能够让身体比例更加协调

国防时报军情|美国再出新招：将研制新型战机，实施未来直升机计划，为对抗中俄

地方|尤氏比王熙凤地位尊贵的多，这个地方她能进，凤姐没资格！

重庆2号线最早几点开重庆轨道交通2号线早晚高峰高开列车

车家号|630马力新超跑，玛莎拉蒂MC20全球首发，新“海王”来了

庞统那么厉害为什么会死?历史上的诸葛亮和庞统谁更厉害

经济日报|多地继续升级楼市调控支持刚需成关键词

肖战@被封杀？因不可抗拒的压力删掉肖战所有镜头，他是劣迹艺人？

|为什么懂人情世故的人更容易赚大钱，看懂的能少奋斗5年