深度学习|Adam又要“退休”了？耶鲁大学团队提出AdaBelief优化器( 二 ) |优化器|AI|

在CIFAR-10和CIFAR-100数据集上，用VGG11、ResNet34和DenseNet121三种网络进行训练， AdaBelief都显示出更好的收敛结果。
而且在ImageNet数据上， AdaBelief在Top-1准确率上仅次于SGD 。

本文插图

时间序列建模
在Penn TreeBank数据集上，用LSTM进行实验， AdaBelief都实现了最低的困惑度。

本文插图

GAN
在WGAN和WGAN-GP上的实验表明，经AdaBelief训练的结果都得到了最低的FID 。

本文插图

网友质疑
虽然AdaBelief在多个任务上取得了不错的效果，但该方法还是遭到不少网友质疑。
因为这些年来号称取代Adam的优化器不计其数，但最终获得时间检验的却寥寥无几。
网友首先质疑的是实验baseline的选取问题。
有人认为，在CIFAR上，很难相信2020年SOTA模型的准确率低于96％，因此AdaBelief论文最终在选取baseline时有可能是选择了与不太好的结果进行比较。
在ImageNet测试的表2里，为什么要使用ResNet18代替更标准的ResNet50？而且AdaBelief不是最优结果，却用加粗方式标出，容易让人产生误解。绝妙的技巧是将提出的方法的得分加粗。
另外，还有人在作者未测试的NLP任务上进行实验，很快AdaBelief就“崩溃”了，而SGD能够很好地收敛。

本文插图

【深度学习|Adam又要“退休”了？耶鲁大学团队提出AdaBelief优化器】AdaBelief不会是最后一个意图取代Adam的优化器，它的泛化能力究竟如何，还有待更多研究者进一步地检验。

深度学习|Adam又要“退休”了？耶鲁大学团队提出AdaBelief优化器( 二 )

推荐阅读

央视网|《焦点访谈》关注王家坝泄洪之后：当地已制定恢复生产预案

怎样快速提升店铺人气店铺要怎样才生意旺人气旺

电影|抖音B站 “三分钟看电影”前景堪忧遭优爱腾联合抵制

中芯国际|炸锅！突发三大利空！

整形：一个变成“猪鼻子”，一个腿歪了？整形医院院长：我也有留疤

冬季每年都有，冻疮也每年都会来，教你5招，拒绝它再来

『手机中国』魅族17系列屏幕怎么样？全系全量定制的三星护眼屏

中年滴滴崩了冲上热搜！网友：今天最主要的任务是等放假 …

|全面开战？基辅发生多次爆炸，导弹差点直接打掉乌总统办公室

紫微星|苏有朋多次表白遭婉拒，却低调嫁圈外人，靳东是她''亲哥哥''

北京日报|大兴机场临空区打造生命健康产业集群

安北随意聊|亚洲扁平臀也可逆袭，110斤的韩国妹子，靠健身练出欧美臀

「东东谈历史」是张飞最拿手的出手的一战，你怎么看呢？，张飞和张郃的巴西之战

【美国】当前的全球疫情，美国很可能成为第一名，印度将成为最大的\黑马\！

联发科|最新中国智能手机SoC榜出炉：联发科登顶、海思第四

因为挫折导致生活很混乱的人，怎样恢复曾经积极自律的生活

中国网科技|未来三年每季度向股东派息约2500万美元，欢聚集团二季度营收超58亿

点赞|社区医生变教师！良都这个公益书画培训班，街坊们都点赞！

|违规获取个人信息，多款APP“正在偷听”

物联网郑州物联网环境如何