大数据文摘■生成描述性文字的新平台,用语言加强AI在动态环境的学习( 二 )


此外 , 研究人员评估了使用设置后指令的基准 , 并在BabyAI++平台上开发了一种新的方法来进行基于视觉的语言学习 。 大量的实验表明 , 使用描述性文本可以提高具有各种动态变化的环境中RL智能体的通用性 。
本文提出的BabyAI++平台及其公开代码和基准实现 , 有望刺激该领域进一步的研究发展 。
了解更多:
https://arxiv.org/abs/2004.07200v1
自监督单眼6D对象姿态估计
【大数据文摘■生成描述性文字的新平台,用语言加强AI在动态环境的学习】最新发现 , 即使是单眼图像 , CNN也能预测较为准确的6D姿态 。 但也有人称CNN的这一实现依赖大量数据驱动 , 而获取足够的带注释数据通常非常耗时且费力 。
为了解决这一难题 , 本文的研究人员提出通过自监督学习进行单眼6D姿态估计 , 从而消除对有注释的真实数据的需求 。 本文提出的自监督网络先在合成RGB数据的监督下进行训练 , 再利用神经渲染的最新技术对未注释的真实RGB-D数据进行自监督学习 , 以寻求最佳的视觉和几何对齐 。
广泛的评估结果表明 , 该自监督网络能够显著提高原始CNN的性能 , 且优于依赖合成数据或采用领域适应(domain adaptation)领域复杂技术的其他所有方法 。
了解更多:
https://arxiv.org/pdf/2004.06468v2.pdf
其他爆款论文
用于搭建高性能ML模型的开源服务平台 BentoML:
https://docs.bentoml.org/en/latest/
识别用于COVID-19的药物再利用机会的网络医学框架:
https://arxiv.org/abs/2004.07229v1
用于评估离线RL算法的基准任务和数据集:
https://arxiv.org/abs/2004.07219v1
利用预训练神经机器翻译模型进行强化课程学习 , 通过更好的利用现有预训练模型来节省训练时间:
https://arxiv.org/abs/2004.05757v1
易于集成特定视觉应用 , 用于实时视觉任务的高效基于UAV的AI框架:
https://arxiv.org/abs/2004.06154v1
AI大事件
英特尔联合优达学城(Udacity) 启动纳米学位计划(Nanodegree Program) , 面向Edge AI开发人员进行DL和CV方面培训:
https://www.zdnet.com/article/intel-udacity-launch-nanodegree-program-for-edge-ai-developers/
微软对它的开源编辑器增加了很多新的功能以及进行了改进 。 试试最新版VS Code编写Python:
https://www.zdnet.com/article/microsoft-try-vs-codes-new-python-c-programming-language-tutorials-docker-updates/
谷歌为维护Gmail安全调整其机器学习模型 , 以打击诈骗分子和网络罪犯:
https://www.zdnet.com/article/google-to-gmail-users-coronavirus-phishing-is-targeting-you-this-is-how-we-hit-back/
人工智能可以教给人类什么?问问机器人索菲亚:
https://www.msn.com/en-us/news/technology/ask-sophia-the-robot-what-can-ai-teach-humans/vi-BB12Iizs
大数据文摘■生成描述性文字的新平台,用语言加强AI在动态环境的学习
本文插图

专栏作者介绍
Christopher Dossman是Wonder Technologies的首席数据科学家 , 在北京生活5年 。 他是深度学习系统部署方面的专家 , 在开发新的AI产品方面拥有丰富的经验 。 除了卓越的工程经验 , 他还教授了1000名学生了解深度学习基础 。
LinkedIn:
https://www.linkedin.com/in/christopherdossman/
志愿者介绍
大数据文摘■生成描述性文字的新平台,用语言加强AI在动态环境的学习
本文插图

大数据文摘■生成描述性文字的新平台,用语言加强AI在动态环境的学习
本文插图


推荐阅读