「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器( 二 )


实现
ALAE 的算法训练过程参见下图:
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

ALAE 效果如何?
该研究在多个数据集上评估了 ALAE 的性能 , 实验代码和数据参见 GitHub 地址 。
在 MNIST 上的性能
【「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器】研究者使用 MNIST 数据集训练 ALAE , 并使用特征表示来执行分类、重建和分析解耦能力的任务 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

表 2:不同方法在 MNIST 分类任务上的性能 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

图 3:MNIST 重建效果 。
StyleALAE 学习风格表征的能力
研究者在 FFHQ、LSUN 和 CelebA-HQ 数据集上评估 StyleALAE 的性能 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

表 3:不同方法在 FFHQ 和 LSUN 数据集上的 FID 分数 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

表 4:不同方法的感知路径长度(PPL) , 表示表征解耦程度 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

图 5:FFHQ 重建结果 。 StyleALAE 对未见过的图像的 1024×1024 重建结果 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

图 6:StyleALAE 的 FFHQ 生成结果(1024 × 1024 分辨率) 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

图 9:StyleALAE 的风格混合效果 。 「coarse styles」从 Source 图像中复制了高级特征 , 如姿势、大致发型和脸型 , 从 Destination 图像中复制了所有颜色(眸色、发色和光照);「middle styles」从 Source 图像中复制了较小型的面部特征例如发式、眼睛睁/闭 , 从 Destination 图像中复制了脸型;「fine styles」从 Source 图像中复制了颜色和微结构 。
「机器之心」人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图

图 8:不同方法在 CelebA-HQ 数据集上的重建结果 。 第一行是真实图像;第二行:StyleALAE;第三行:Balanced PIONEER;第四行:PIONEER 。
从图中可以看出 , StyleALAE 的生成结果更加清晰 , 失真度也最低 。


推荐阅读