PaperWeekly|积分梯度：一种新颖的神经网络可视化方法

北京联盟_本文原题：积分梯度：一种新颖的神经网络可视化方法
?PaperWeekly 原创 · 作者｜苏剑林
单位｜追一科技
研究方向｜NLP、神经网络
本文介绍一种神经网络的可视化方法：积分梯度（Integrated Gradients），它首先在论文 Gradients of Counterfactuals[1] 中提出，后来 Axiomatic Attribution for Deep Networks[2] 再次介绍了它，两篇论文作者都是一样的，内容也大体上相同，后一篇相对来说更易懂一些，如果要读原论文的话，建议大家优先读后一篇。
当然，它已经是 2016-2017 年间的工作了， “新颖”说的是它思路上的创新有趣，而不是指最近发表。
所谓可视化，简单来说就是对于给定的输入 x 以及模型 F(x) ，我们想办法指出 x 的哪些分量对模型的决策有重要影响，或者说对 x 各个分量的重要性做个排序，用专业的话术来说那就是“归因” 。一个朴素的思路是直接使用梯度来作为 x 各个分量的重要性指标，而积分梯度是对它的改进。
然而，笔者认为，很多介绍积分梯度方法的文章（包括原论文），都过于“生硬”（形式化），没有很好地突出积分梯度能比朴素梯度更有效的本质原因。本文试图用自己的思路介绍一下积分梯度方法。
朴素梯度
首先，我们来学习一下基于梯度的方法，其实它就是基于泰勒展开：

本文插图

我们知道是大小跟 x 一样的向量，这里为它的第 i 个分量，那么对于同样大小的，的绝对值越大，那么相对于的变化就越大，也就是说：
衡量了模型对输入的第 i 个分量的敏感程度，所以我们用作为第 i 个分量的重要性指标。
这种思路比较简单直接，在论文 How to Explain Individual Classification Decisions[3]和 Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps[4]都有描述，在很多时候它确实也可以成功解释一些预测结果，但它也有明显的缺点。
很多文章提到了饱和区的情况，也就是一旦进入到了饱和区（典型的就是的负半轴），梯度就为 0 了，那就揭示不出什么有效信息了。
从实践角度看，这种理解是合理的，但是笔者认为还不够深刻。从之前的文章对抗训练浅谈：意义、方法和思考（附 Keras 实现）可以看出，对抗训练的目标可以理解为就是在推动着，这也就可以理解为，梯度是可以被“操控”的，哪怕不影响模型的预测准确率的情况下，我们都可以让梯度尽可能接近于0 。
所以，回到本文的主题，那就是：确实衡量了模型对输入的第 i 个分量的敏感程度，但敏感程度不足以作为重要性的良好度量。
积分梯度
鉴于直接使用梯度的上述缺点，一些新的改进相继被提出来，如 LRP[5]、DeepLift[6] 等，不过相对而言，笔者还是觉得积分梯度的改进更为简洁漂亮。
2.1 参照背景
首先，我们需要换个角度来理解原始问题：我们的目的是找出比较重要的分量，但是这个重要性不应该是绝对的，而应该是相对的。比如，我们要找出近来比较热门的流行词，我们就不能单根据词频来找，不然找出来肯定是“的”、“了”之类的停用词，我们应当准备一个平衡语料统计出来的“参照”词频表，然后对比词频差异而不是绝对值。这就告诉我们，为了衡量 x 各个分量的重要性，我们也需要有一个“参照背景”。
当然，很多场景下我们可以简单地让，但这未必是最优的，比如我们还可以选择为所有训练样本的均值。我们期望应当给一个比较平凡的预测结果，比如分类模型的话，的预测结果应该是每个类的概率都很均衡。于是我们去考虑，我们可以想象为这是从 x 移动到的成本。

PaperWeekly|积分梯度：一种新颖的神经网络可视化方法

推荐阅读

ZAKER|格力电器、四大银行等热门公司公布中报：工行净利同比降11%

带了4年外孙，一碗药让老人寒了心：再闲也不帮女儿带娃

财华社|「港版纳指」将吸引更多科技企业来港上市，摩根大通:

看电视吃零食易患胆结石

综艺|岳云鹏在线吐槽节目组，评论区一片附和声：就是，这也太过分了

副本|魔兽世界9.0橙装本跳车事件惹争议，暴雪默许，普通玩家遭殃？

#环球时报评论#欧盟向意大利道歉了

『PMCAFF产品经理社区』AI付出了多少努力，为了读懂你

针孔相机有什么优点

邮轮|又是一夜风暴！苹果、亚马逊、脸书惨遭抛售！美股3月以来最差…

梅尔顿|丹东尼通知火箭不再回归小范甘迪有望成为接任者

胸外科硬质气管镜技术为气管疾病患者打通生命通道

曝光|淡紫鞋面有点小清新！LeBron 18 全新配色曝光！

11 个可以部署在 Linux 服务器上的开源论坛软件

局域网ip电话系统 ip交换机

女孩的英语名字大全好听女孩的英语名字

红茶揉捻的时间,红茶冲泡有沫

「读史鉴文」生肖兔2020（庚子）年流年运程详解！

张学良|张学良在离世前曾说，一生最佩服一个人，不是毛主席也不是蒋介石

【牛肉腌制又滑又嫩方法】牛肉腌制又滑又嫩方法