追着幸福跑|为什么深度神经网络这么难训练？| 赠书( 五 ) 导读：本文内容节选自《深入浅出神经网

当然，实际情况并非如此。想想随机初始化神经网络中的权重和偏置。对于任意任务，单单使用随机初始化的值难以获得良好结果。具体而言，考虑MNIST问题中神经网络第1层的权重，随机初始化意味着第1层丢失了输入图像的几乎所有信息。即使后面的层能得到充分的训练，这些层也会因为没有充足的信息而难以识别输入图像。因此，第1层不进行学习是行不通的。如果继续训练深度神经网络，就需要弄清楚如何解决梯度消失问题。
梯度消失的原因
为了弄清楚梯度消失问题出现的原因，看一个极简单的深度神经网络：每层都只有单一神经元。图5-9展示了有3个隐藏层的神经网络。

表达式结构如下：每个神经元都有
项，每个权重都有
项，此外还有一个
项，它表示最终的代价函数。注意，这里将表达式中的每一项置于对应的位置，所以神经网络本身就是对表达式的解读。
你可以不深究这个表达式，直接跳到下文讨论为何出现梯度消失的内容。这样做不会影响理解，因为实际上该表达式只是反向传播的特例。不过，对于该表达式为何正确，了解一下也很有趣（可能还会给你有益的启示）。
假设对偏置
做了微调
，这会导致神经网络中其余元素发生一系列变化。首先会使得第1个隐藏神经元输出产生
的变化，进而导致第2个隐藏神经元的带权输入产生
的变化，第2个隐藏神经元输出随之产生
的变化，以此类推，最终输出的代价会产生
的变化。这里有：

追着幸福跑|为什么深度神经网络这么难训练？| 赠书( 五 )

推荐阅读

大话NBA|拿什么来争？，湖人要与篮网抢东部第一分卫

毛笔颂——纪念毛泽东诞辰（作者：进静净）

宁波旅游必去十大景点，去宁波旅游必玩景点有哪些

新华网|“创客之夜”亮相全国双创活动周看硬科技如何激活新动能

从新疆开汽车去巴基斯坦需要给汽车办理啥手续

娇嫩娇嫩果蔬守卫战美的智能保鲜冰箱果润维C系列领“鲜”发声

山西晋城一在建隧道发生塌方致1人死亡5人被困

烤箱沾锡纸家庭烤箱锡纸清洗方法

手机|“保温杯”成学生藏手机神器！网友：商家无底线

袁天罡曾与一老农打赌，原本胜券在握，结果却是完败，怎么回事呢

青海日报|海拔3300米！我们的青贮玉米丰收了

深林游鹿：振动刀切割机行业为什么会迅速发展？

河南很可悲的2个城市，一个是全国百强城市，一个是濮阳

毕业生|北京：为困难家庭毕业生至少推荐3次就业岗位

创业板|价格笼子还是增压发动机？创业板新交易规则引热议

曝光张首芳的各种信息张首芳简介个人资料

央视新闻|直升机中的“F-117”：揭秘科曼奇隐身武装直升机！

骑士|骑勇大战的再次交手！乐透抽签库里助勇士夺榜眼，骑士仅仅第五

被子的价格是多少，如何选择

中国青年网@[新中国70年，镇馆之宝70件](三)一碑守公田，勿忘红