游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家

游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

新智元报道
来源:微博等
编辑:啸林、白峰
【新智元导读】北京90后程序员大谷用AI修复百年前北京的视频 , 完全火出了圈 。 他为何这么牛?看完技能树 , 我彻底酸了:游戏、漫画、3D、VR、音乐样样精通 , 跑AI模型也手到擒来 。 「新智元急聘主笔、高级主任编辑 , 添加HR微信(Dr-wly)或扫描文末二维码了解详情 。 」
最近 , 一位程序员做的用AI修复百年前北京的视频 , 彻底火出圈了 。
自称“程序员里最会画画的作曲家”的博主@大谷Spitzer制作的这个视频 , 在微博获得了60万赞和13万转发、3万多评论 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

在B站上在3天内就获得了120万播放量 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

在影片的一开始 , 我们便被拉回到民国初年 , 1920年 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

1920年的北京紫禁城依然维持着一个清王朝遗留下来的逊清皇室小朝廷 , 一直持续到1924年11月5日国民军正式进入接管 , 溥仪被迫出宫 。
老外在逗狗 。 B站弹幕评论:“告诉你一个恐怖消息:视频里的人都已作古” 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

熙熙攘攘的集市 。 很多清代的社会文化风俗在当时还继续维持着 , 所以会出现许多未剃发的市民 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

?
一个小孩在街头买了吃的 , 坐在别人家门口吃 , 被出门的人看见赶跑 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

?
还能看到那时的人见面相互打躬作揖 , 礼仪非常讲究 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

据网友科普 , 视频里有三种礼仪:第一种 , 打千礼 , 满人专用 。 第二个礼是作揖 , 汉人男子之间的见面礼 , 看见过孔子像吗他就在作揖 。 第三个是万福礼 , 汉人女子的见面礼 , 古代女子通用 。
?
还能看到做白事抬棺现场 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

?
大谷给视频配上了BGM , 大部分都是北京民俗的历史文化录音 , 视频中出现的道教音乐出自北京白云观 。
下面让我们看看原版视频:

视频怎么做出来的?用了3种开源AI工具
这里面一共用了3个在GitHub上开源的AI程序 , 第一个是负责做补帧的DAIN , 第二个是做分辨率扩增的ESRGAN , 第三个是上色的DeOldify , 综合到一起才做成了这个视频 。
此外还用付费的VirtualDub做了一些老电影降噪处理 , 以及其他许多插件 。
DAIN:深度感知视频帧插值(DAIN)模型 , 通过探索深度信息来显式地检测遮挡 。 该项目开发了一个深度感知流动投影层 , 优选取样更近的物体 , 以合成中间流插补视频帧 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

ESRGAN:ESRGAN改进自SRGAN, 主要用来做视频超分辨率 。 与SRGAN的深层模型越来越难以训练相反 , 更深层次的 ESRGAN 模型通过简单的训练就能达到卓越的性能 , 核心点在于平衡视觉质量和峰值信噪比的网络插值策略 。
游戏90后「六指魔琴」AI修复100年前老北京影像,他还是程序员里最会画画的作曲家
图片

DeOldify:DeOldify 使用了NoGAN 进行训练 , NoGAN对于获得稳定和丰富多彩的图像是至关重要的 。 NoGAN 训练结合了 GAN (美妙的着色)的好处 , 同时消除了副作用(如视频中的闪烁对象) 。 视频渲染使用孤立的图像生成 , 没有天际任何时间建模 。


推荐阅读