中年技术分享——深度学习的基础入门 |技术|入门|

在深入研究激活函数的细节之前，让我们快速浏览一下神经网络的概念以及它们如何工作。神经网络是一种非常强大的机器学习机制，基本上可以模仿人脑的学习方式。
大脑从外界接收刺激，对输入进行处理，然后生成输出。随着任务的复杂化，多个神经元形成一个复杂的网络，在彼此之间传递信息。

本文插图
人工神经网络试图模仿类似的行为。在下面看到的网络是由相互连接的神经元组成的神经网络。每个神经元的特征在于其重量，偏见和激活功能。

本文插图
输入被馈送到输入层，神经元使用权重和偏差对该输入执行线性变换。
x =（重量*输入）+偏差在此之后，激活功能将应用在上述结果中。
最后，激活函数的输出移至下一个隐藏层，并重复相同的过程。信息的这种前向运动称为前向传播。
如果生成的输出与实际值相去甚远怎么办？使用前向传播的输出，可以计算误差。基于此误差值，将更新神经元的权重和偏差。此过程称为反向传播。
那没有激活功能可以做吗？
我们知道，使用激活函数会在正向传播过程中在每一层引入一个额外的步骤。现在的问题是–如果激活函数增加了复杂性，那么如果没有激活函数就可以做吗？

本文插图
想象一下没有激活功能的神经网络。在那种情况下，每个神经元将仅使用权重和偏差对输入执行线性变换。尽管线性变换使神经网络更简单，但是该网络的功能将减弱，并且将无法从数据中学习复杂的模式。
没有激活函数的神经网络本质上只是线性回归模型。
因此，我们对神经元的输入使用了非线性变换，并且网络中的这种非线性是由激活函数引入的。
【中年技术分享——深度学习的基础入门】常用类型的激活功能
1.二进制步进功能
当我们具有激活函数时，我们想到的第一件事就是基于阈值的分类器，即是否应基于线性变换的值来激活神经元。
换句话说，如果激活函数的输入大于阈值，则激活神经元，否则将其禁用，即，对于下一个隐藏层不考虑其输出。
2.线性函数
我们看到了阶跃函数的问题，函数的梯度变为零。这是因为二进制步进函数中没有x的分量。除了二元函数，我们可以使用线性函数。
3.乙状结肠
我们要看的下一个激活函数是Sigmoid函数。它是使用最广泛的非线性激活函数之一。 Sigmoid会转换介于0和1之间的值。
4. ReLU
ReLU函数是另一种非线性激活函数，已在深度学习领域流行。 ReLU代表整流线性单位。与其他激活功能相比，使用ReLU功能的主要优势在于它不会同时激活所有神经元。
这意味着仅当线性变换的输出小于0时，神经元才会被停用。下面的图将帮助您更好地理解这一点-
f（x）=最大值（0 ， x）

本文插图
对于负输入值，结果为零，这意味着神经元未激活。由于仅激活一定数量的神经元，因此与S型和tanh函数相比， ReLU函数的计算效率要高得多。
还有包括泄漏的ReLU、参数化ReLU、指数线性单位、Swish、Softmax等
怎么选择正确的激活功能
现在我们已经看到了很多激活函数，我们需要一些逻辑/试探法来知道在哪种情况下应该使用哪个激活函数。好与坏没有经验法则。

中年技术分享——深度学习的基础入门

推荐阅读

「新华网」坚决维护新疆安定祥和繁荣发展的大好局面

错误|不管犯了什么错误，都会选择原谅的星座，看看都有谁？

思淼谈历史|就在敌人眼皮子下，被炮弹炸伤一声不吭，3500人埋伏19小时

砸34亿：华为汽车BU短期不考虑赚钱

胖虎追泡泡▲致电美国想要求助，美反问：我们的物资呢？，日本企业停工停产

扭牛说电影：看到最后一款：大招范围变大了，王者自带隐藏加成的皮肤

行李托运有哪些规定？托运行李

气象灾害|新华网评：别把预警不当回事儿

市住建委：企业年降直接成本中心城区达十几亿

这里是厦门|以前的校长都能上课，为什么现在的几乎都不上课，什么变了？

富婆|40岁富婆年薪十万招男司机，却无人敢去应聘，到底是为何？

非师范生考教师证步骤是什么？

「武汉」天际线、水岸线、灯光秀、生态绿美不胜收，一片清爽扮靓

苏伟|3消息！爆外援引进又要暂停，苏伟亲承恐离队，本土球员有望创史

安徽最厉害的县，富裕程度远超芜湖马鞍山，池州黄山极具压力

周扒皮看热闹|欧拉白猫VS奇瑞小蚂蚁，难分胜负，新能源汽车崭露头角

帮助别人减轻痛苦?受到了帮助再帮助别人

编程重度爱好者|新冠肺炎与特朗普：促进C语言登顶Tiobe榜首？

里弗斯|里弗斯：小卡的领导力让我想到尤因 G2对手会让我们远离油漆区

专升本到底难不难专升本难吗通过率多少