余温|ECCV 2020 Oral | TCGM：基于信息论的半监督多模态学习框架本文是计算机视觉领域顶级会议ECCV2020

本文是计算机视觉领域顶级会议 ECCV 2020 入选 Oral 论文《基于信息论的半监督多模态学习框架（TCGM: An Information-Theoretic Framework for Semi-Supervised Multi-Modality Learning）》的解读。
作者 | PKU CVDA
编辑 | 青暮
论文链接：
1
引言比起仅仅利用单个模态的数据，融合多个模态的数据信息能够训练出更加准确且鲁棒的分类器。比如，模型可以用X光图片、临床指标等数据来预测病人的身体情况。但是在实际中，多模态的精标注数据十分昂贵，往往只能在每个模态上获取少量标注数据。如何利用少量的多模态标注数据来高效地训练分类器成为一个关键问题。
本文将这个问题转化为等价的半监督+多模态学习问题。在这个背景下，我们关注如何在训练中利用好未标注的多模态数据。本文的贡献在于，设计一个全相关（Total Correlation）的下界作为在未标注的多模态数据上的目标函数，来更好地融合跨模态的信息。全相关（Total Correlation）是关于多个随机变量之间共有信息的度量，在两个随机变量下全相关退化为互信息（Mutual Information）。
更具体地，本文提出去最大化每个模态的全相关增益(Total Correlation Gain) 。每个模态上都有一个分类器，而这些分类器的共同的目标就是在未标注数据上，去最大化它们的全相关增益。若我们假设所有模态的信息关于真实标注（ground truth）是条件独立的，最大化全相关增益直观地来看是去找到所有模态之间的“信息交集” ，即真实标注。如下图所示：左图是对条件独立的直观阐释，右图是对真实标注是“信息交集”的图示。在最大化全相关增益的过程中，每个模态上的分类器能够更好地利用其他模态的信息。
图1. （左图）条件独立假设；（右图）真实标注是“信息交集”
2
方法给定未标注的数据集与标注数据，其中
关于如何衡量全相关增益，本文扩展[1]中的互信息增益到全相关增益上。它的实质是在给定密度比值后的对偶下界。全相关增益具体表达如下：
其中为从共同分布中采样的样本数。直观来看，全相关增益鼓励分类器在采样自共同分布的多模态数据上的输出结果相似（第二项），在采样自边缘分布乘积的数据上的输出结果不同（第三项），类似对比学习（Contrastive Learning）。在时的可视化见下图。此外，我们证明了在期望下，当每个模态上的分类器是贝叶斯最优分类器时，全相关增益取得最大值。
图2. 三个模态上 TCGM 的计算
3
实验结果我们在三个多模态数据集上验证我们的方法：新闻分类数据集 Newsgroup；情感分类数据集 IEMOCAP 与 MOSI；与医疗图像数据集 ADNI 。我们在不同比例的标注数据下做了多组实验，结果如下：

余温|ECCV 2020 Oral | TCGM：基于信息论的半监督多模态学习框架

推荐阅读

【猫眼娱乐V】安娜·温图尔儿子确诊新冠，曾陪英国女王看秀，被授予王室勋章，原创

NBA官网|湖人将获1200万美元收入，打剩下8场常规赛

zol中关村在线海信护眼平板Q5评测：护眼不是这平板的所有特色

81平米现代风装修，二居室的房子越看越有品

车轱辘|优享价5.39万起，凯翼炫界正式上市。，林允代言

可口可乐|再来一瓶无法就近兑奖：魔爪饮料被罚20万

「易度时尚」炫酷和粉嫩，谁是火箭少女腿精？，杨超越吴宣仪同穿“肥宅T恤”

乐居财经：代价约1.51亿港元，泛海酒店购入面值2180万美元恒大票据

黑乎乎还是黑呼呼

小种红茶的几岁老人喝,小种茶的泡法

【新冠肺炎】截至12日北京新冠肺炎线上医生咨询平台访问量234万余人次

大腕儿娱乐1 中国却研究发展的最好，日本网友怒斥：明明是我们最先研究

滇红茶古树晒红,普绿古树红茶

辽宁男篮|11战轰334分！30万临时工打出巨星数据，辽蜜：加薪，下季续约他

关于恋爱，是不是应该忽冷忽热忽近忽远

【影之书数码】最有性价比的8+128GB千元机，还支持NFC，从1799降至1329

『向阳愿景TB』你只知道广州的早茶，却不懂它的宵夜

本·拉登|拉登的妻子和情人众多，揭秘他身边的女人们(组图)

中国网科技|老股东亲述：易果生鲜如何从宠儿走到破产重整？

让“微光”燎原