|普林,DeepMind新研究:结合深度学习符号回归,深度模型中看见宇宙( 二 )

符号回归 + 深度学习，如何实现？
这项研究采用的策略是：深度模型不仅可以预测目标，还能够将这些目标分解为低维空间中运行的较小内部函数；然后，符号回归利用解析表达式来近似深度模型的每个内部函数；最后，将提取到的符号表达式组合在一起，得到一个等价的解析模型。
具体步骤如下所示：
设计一个深度学习模型，它具有可分离的内部结构和由问题引发的归纳偏置；
使用可用数据对模型进行端到端训练；
在训练过程中，鼓励每个内部函数输入或输出中的潜在表示保持稀疏性；
用符号表达式拟合模型内部学得的不同函数；
以等价的符号表达式替换深度模型中的这些函数。
具体而言，在相互作用粒子案例中，研究者选择了图神经网络架构，因为其内部结构可以分解为三个与粒子交互物理相对应的模函数（modular function）。其中 GNN 的「消息函数」相当于力，「节点更新函数」相当于牛顿运动定律。 GNN 在多个基于物理学的应用中获得成功。
下图展示了该研究实验中所使用的 GNN 内部结构：

本文插图

需要注意的是：不同于牛顿力学， GNN 中的消息形成高维潜在向量，节点不用表示物理粒子，边和节点模型可学习任意函数，并且输出不必为更新后的状态（updated state）。
最后，通过鼓励 GNN 中的消息来增强稀疏性，该研究降低了每个函数的维数，使得符号回归更易于提取表达式。
下图展示了结合 GNN 和符号回归提取分析表达式的过程：

本文插图

实验效果
牛顿动力学
研究者在具备已知力学定律的简单多体（N-body）系统数据上训练牛顿动力学图网络。然后通过消息函数 φ^e 学得的表示，运用该方法获得已知的力学定律。
如下图 4 所示，研究者采用的数据集包含不同交互作用定律下的二维和三维多体粒子模拟。模拟本身包含 4 或 8 个粒子的质量和电荷，并以位置、速度和加速度作为时间函数的参数。

本文插图

在当前系统状态下，研究者训练模型来预测每个粒子的瞬时加速度。为了探究消息表示的大小在将消息解释为力中的重要性，研究者使用 Standard、Bottleneck、L_1 和 KL 四种不同的策略来训练图网络。
模型性能
为了评估学得的模型，研究者用不同的随机种子生成了一个新的数据集。研究发现，使用 L_1 正则化的模型在大多数情况下具备最佳性能，如下表 3 所示：

本文插图

表 3：不同模型在每个数据集上的预测损失。
解释消息组件
作为解释消息组件的首次尝试，研究者采用了具备最大方差（或 KL 散度）的 D 消息特征（D 是模拟的维数），并用每个特征拟合真正分力的线性组合。
研究者发现在标准设置下训练的图网络并没有显示出和分力的强相关性。

本文插图

而有效消息大小被显式（瓶颈）或隐式（KL 或 L_1）限制为低维的所有其他模型所得到的消息与真实的力具备强相关关系（表 1 指出了与真实力的拟合误差），其中使用 L_1 正则化训练的模型显示出最强的相关性。

本文插图

|普林,DeepMind新研究:结合深度学习符号回归,深度模型中看见宇宙( 二 )

推荐阅读

青年|丁俊晖世锦赛冲冠！中国00后3-0霸气反击，连扳三局追成4-4

历史|【基层联影】用历史搭建桥梁共谱新时代民族精神

台风＂利奇马＂席卷日冲绳:1万多户断电超市被买空

夏季野钓的三个小妙招，学会这样用饵，大板鲫手到擒来

新视角看民生|凶手是自家亲戚，和一个孩子有什么仇，8个月的宝宝竟然惨遭毒手

妈咪学堂曾带队战胜RNG，SandBox引入首位LCK外援教练

「北京」北京一炸糕店推出荡秋千无接触售卖方式

再论金水伤官喜见官金水伤官

罗森博格|昨临场拿下，今日分享五场：抢分能力不俗罗森博格主场再添胜绩

室友除了看A片戴耳机，看其他的视频都功放是一种啥心态

「站长之家」英国政府称不需要了，坑！戴森斥资2500万美元造呼吸机

喝茶需要注意的事项,喝普洱生茶有什么需要注意的地方

各大社交网站的黄金时代是啥时候

新华社|新华财经|央行净投放1000亿元

养老金▲企业退休职工每月养老金只有1500元，在全国属于什么水平？够吗？

高开高走|价格高开高走市场流通有序安徽省秋粮收购开局良好

人人都吃过的扬州炒饭，简单的做法却不一样的美味，味道赞

人民日报客户端|人社部：上半年全国城镇新增就业564万人

中亚“第一隧道”终于打通：中国花了900天，将他们回家的时间缩

财经眼|原油中线机会来临，6.7黄金短线需反弹