计算机视觉工坊汇总|实时性语义分割算法（上篇）( 三 )

链接：https://openreview.net/pdf?id=S1uHiFyyg
该架构包括ELU激活功能、一个类似挤压式的编码器、随后的并行扩展卷积以及一个具有类似于sharpmask的细分模块的解码器

本文插图
译文：该编码器是一个改进的SqueezeNet 架构，它被设计为一个低延迟的网络，用于图像识别，同时保持AlexNet的准确性。

本文插图
实验结果：

本文插图
【7】高效卷积网络用于实时语义分割
实时语义分割的《Efficient ConvNet for Real-time Semantic Segmentation》
链接：
http://www.robesafe.uah.es/personal/eduardo.romera/pdfs/Romera17iv.pdf
Efficient ConvNet模型整体结构遵循编码-解码结构，

本文插图

本文插图
详细构造如下表：

本文插图
整个模型包含23层，其中1-16层为Encoder ， 17-23层为Decoder 。
编码部分包含1、2、8层的下采样过程，以及余下层的Non-bt-1D提取特征。其中Non-bt-1D、Downsample构造如下：

本文插图
实验结果：

本文插图

本文插图
【8】ERFNet:用于实时语义分割的高效残差分解卷积网络
《ERFNet: Efficient Residual Factorized ConvNet for Real-time Semantic Segmentation》
链接：
http://www.robesafe.es/personal/eduardo.romera/pdfs/Romera17tits.pdf
REFNet沿用了编码-解码结构，其详细结构如表所示。

本文插图

本文插图
整个网络包含23层，其中1-16层为Encoder, 17-23层为Decoder 。
Downsampler block受另一个实时语义分割网络Enet的设计，其实本文不少灵感也来自于Enet：
例如在初始图像输入1024X512X3 ，左边经过3X3卷积，步长strides = 2 ，得到16 channels ，
右边经过MaxPooling 得到3 channels ，经过concat操作后得到16channels ，最终图像变为 512X256X16 ，然后使用Relu函数激活传入下一层。
优点在于从输入图像一开始就进行了减少输入图像尺寸的操作，本身视觉信息就存在大量冗余，这样节省了大量的计算。
【9】EDANet：用于实时语义分割的高效的非对称卷积密集模块
《Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation》
链接：https://github.com/shaoyuanlo/EDANet
模型框架如下：

计算机视觉工坊汇总|实时性语义分割算法（上篇）( 三 )

推荐阅读

【cnBeta|Pencil笔尖适配器增加力感应按键，苹果公司研究Apple】

个人如何出书如何出书

花间雨屋星座2020年下半年运气极佳的四大星座，好运来报道

北京经纬恒润科技深圳分公司咋样

河南|太极之乡——河南陈家沟

二地黄酒方的功效与作用

bobo妈妈|单亲家长该如何做，马伊琍“人设”崩了！女儿喊话：妈妈不要装了

大S|大S前经纪人曝小S秘辛，徐妈难耐寂寞再找男友，大S被催复出赚钱

咋对待聊天时突然不说话的人

超人爸爸谈育儿|三招让娃信心满满，孩子内向没自信？可能是“自我效能感”太低

保护个人信息安全四部门开展新一轮App治理

马方明医生@脾大的常见原因？脾大能自己恢复吗？

油皮用补水面膜还是保湿面膜,最适合油性皮肤的补水面膜-

魔道祖师：金凌大小姐团宠背后是无尽的心酸，无父无母让人泪目！

闽南|世界级非遗！深藏于闽南的“送王船”，是怎样一种盛况？

网友热议|疫情加剧！教育部：中高风险地区将暂缓秋季开学、学生暂缓返校

28岁女没结婚,该发愁吗,女生28岁了还没有结婚的想法-

中金网原油主题基金套牢抄底客，净值暴跌规模反升

华为2019年年报发布 HMS生态加速全球布局

淘宝怎么国际转运淘宝国际转运流程