追着幸福跑|为什么深度神经网络这么难训练？| 赠书( 七 ) 导读：本文内容节选自《深入浅出神经网

练习
在关于梯度消失问题的讨论中，我们采用了
这个结论。假设使用一个不同的激活函数，其导数值更大，这有助于避免梯度不稳定问题吗？
5.2.4 梯度消失问题普遍存在
如前所述，在神经网络中，前面的层可能会出现梯度消失或梯度爆炸。实际上，在使用sigmoid神经元时，通常发生的是梯度消失，原因见表达式
。为了避免梯度消失问题，需要满足
。也许你认为如果
很大就行了，实际上更复杂。原因在于项同样依赖：
，其中
是输入激活值，所以在让
变大时，需要保持
不变小。这会是很大的限制，因为变大的话，也会使得
变得非常大。看看的图像，就会发现它出现在的两翼外，取到很小的值。为了避免出现这种情况，唯一的方法是让输入激活值落在相当小的范围内（这个量化的解释见下面第一个问题）。这种情况偶尔会出现，但通常不会发生，所以梯度消失问题更常见。
问题
考虑乘积
。假设有
，请完成如下证明。
(1) 证明这种情况只在
时才会出现。
(2) 假设，考虑满足
的输入激活值的集合。请证明：满足上述条件的集合跨了一个不超过如下宽度的区间。
(3) 证明以上表达式在
时取最大值（约为0.45）。所以，即使每个条件都满足，仍有

追着幸福跑|为什么深度神经网络这么难训练？| 赠书( 七 )

推荐阅读

安心生活研究所|都是苦行僧般的自律，郭麒麟196斤旧照曝光：所有光鲜背后

家养酢浆草，从播种到开花，只需要学会2点，花朵挤满花盆！

『西安信达会计』如何懂得对财务信息进行有效地鉴别？

开学典礼演讲稿高中?2020年开学典礼演讲稿

凤凰金融，京东理财这些互联网理财产品收益还行，那么问题是风险何如

女人|它是穷人的燕窝，3元钱就能煮一大锅，女人常喝，40岁还是少女

交谈技巧有哪些交谈技巧有哪些失败案例并说明原因分析

TVB老戏骨蒋志光承认离巢，最后库存剧将播，离巢后最想做一件事

『女排』巅峰时选择退役、嫁给了1米85的富二代老公，1米9的最美女排队长如今怎么样了？

asp.net core源码如何实现监听Http请求，分析Kestrel看一下过程

数据|人民币对美元汇率中间价上行69个基点

怀孕可以吃维生素C含片吗？怀孕吃什么比较好

厕所铺青石板四周洒鹅卵石可以实现么

暖心小骏|今夏最火妆容，仅需四步即可打造女团脸

历史之奇闻|等到70高龄才造反，他到底在怕什么？，司马懿熬死了曹家3代人

日本|为什么日本癌症死亡率低，存活率高？预防癌症，有哪些妙招？

高通|损失的何止547亿！高通两次发声，这结果特朗普没想到！

「古镇」江苏一古镇沦为空城：玩一圈得重复收费6次，现人去楼空没人愿去

「科技外援队」三星详细介绍Galaxy Z Flip的面板小屏幕功能

许晴|3位至今都没人娶的女星，被称为“绝色美人”，娶到就是血赚啊