追着幸福跑|为什么深度神经网络这么难训练？| 赠书( 八 ) 导读：本文内容节选自《深入浅出神经网

一个小的输入激活值区间，以此避免梯度消失问题。
恒等神经元：考虑一个只有单一输入的神经元
，对应的权重为
，偏置为
，输出上的权重为
。请证明：通过合理选择权重和偏置，可以确保
，其中
。
这样的神经元可用作恒等神经元，即输出和输入相同（按权重因子成比例缩放）。提示：可以重写
，假设很小，以及对
使用泰勒级数展开。
复杂神经网络中的梯度不稳定
前面研究了简单的神经网络，其中每个隐藏层只包含一个神经元。那么，每个隐藏层包含很多神经元的深度神经网络又如何呢？图5-13展示了一个复杂的深度神经网络。
实际上，在这样的神经网络中，同样的情况也会发生。在介绍反向传播时，本书提到了在一个共L层的神经网络中，第l层的梯度是：
其中
是一个对角矩阵，它的每个元素是第l层的带权输入
，
是不同层的权重矩阵，
是每个输出激活值的偏导数向量。
相比单一神经元的情况，这是更复杂的表达式，但仔细看的话，会发现本质上形式还是很相似的，主要区别是包含了更多形如

追着幸福跑|为什么深度神经网络这么难训练？| 赠书( 八 )

推荐阅读

云端之战@印度数千民工与警察起冲突：让我们回家，莫迪宣布这一“铁令”后

晓鑫聊时尚|掌握米色搭配，变得时尚！轻熟女人非常值得尝试的造型

潮帮sir|一个赘肉明显，一个美成焦点，邓文迪与小2岁苏慧伦穿同款百褶裙

人民日报客户端河北频道|走向我们的小康生活：美丽乡村小辛旺

包括但不限于到底是啥意思

刀郎|刀郎女儿出生40天妻子跑路，妻子：你那么穷，给不了我幸福

【基民柠檬】点评支付宝“帮你投”，越期待越失望

美容|是时候叫醒国潮美妆梦了

穿搭|cos：寻找宝藏的少女

ZAKER生活|印尼大部分居民希望结束PSBB，恢复经济，民调显示

自己不愿意与亲戚来往，却让自己的孩子与亲戚来往去亲戚家吃饭啥心理

平面设计转行做房地产销售咋样

纪念抗美援朝70周年大会全体与会人员向在抗美援朝战争中英勇牺牲的烈士默哀

『河南一5A景区推出无人值守一元午餐』河南一5A景区连续四年推出无人值守一元午餐，收入不少反多

外设天下Mad Catz S.T.R.I.K.E.13键盘评测

#北京朝阳公园#北京朝阳公园：即日起所有区域禁止搭设帐篷

2021年腊月二十六宝宝取名大全腊月二十六出生女孩名字

唐朝太平公主死因?唐朝平阳公主名字

酒店住宿行业已损失超两千亿，后疫情时代的民宿如何走出重创？

「宋妈说育儿」宝宝不会畸形吗”孕妈的质问，引出保胎辛酸泪，“每天三针保胎剂