万微科技2016|这个工具有近2000个图像数据集,可免费获取,数据集轻松按需搜索
杨净发自凹非寺量子位报道|公众号QbitAI
每个研究机器学习项目的人 , 似乎都有这样的痛苦 。 那就是从学术网站、GitHub上寻找到合适的数据集 。
但现在 , 有这样一个网站可以帮你搞定 , 让AI开发变得更加简单易行 。

文章图片
这个项目名叫BIFROST , 一个数据集搜索工具 , 里面共有1899个图像数据集 , 还专门设置分类 , 比如Humans、Geospatial、AutonomousCars等 。
一键搜索 , 免费获取 , 直接链接到原始数据库 , 帮你快速找到合适的数据集 。 研究团队来自新加坡 , Reddit上17小时热度200+ 。

文章图片
使用说明
【万微科技2016|这个工具有近2000个图像数据集,可免费获取,数据集轻松按需搜索】话不多说 , 我们就直接来上这个网站来试试~
正如刚才所看到的 , 这个工具是按任务、应用、类别、标签或格式进行分类 。

文章图片
根据「类别」 , 这个网站共分为18类 , 比如Humans、Geospatial、AutonomousCars、Retail、3D等 。

文章图片
向左滑动 , 选择你需要的类别 , 一键即可出结果 , 我们以3D为例 , 然后就呈现这样的页面 。

文章图片
若以「Humans」为例 , 界面是酱紫的 。

文章图片
我们也看到 , 这是按照精选进行排序 。 除此之外 , 你还可以选择「最新」、「最多标签数」、「数据集大小」、「图片数量最多」这些分类 。

文章图片
除了「快速检索」之外 , 还可以根据开发人员的具体需要来进行搜索 。

文章图片
可以选择这些「限定」:任务类型 , 标签格式 , 最小图像数量 。
其中任务类型主要包括 , 图像分割 , 目标检测、图像分类、姿态估计、视觉推理、3D重建、视频分类 。
标签格式包括 , YOLO、PASCAL、COCO以及Segmentation 。
数据集
以COCO为例 , 这是一个适用于目标检测、图像分割和字幕大型数据集 。
界面是这样的:

文章图片
主要分为图像示例、数据集简介、特性、类别分布四个板块 。
在简介部分 , 可以看到这个数据集的研究团队、一句话介绍 , 以及通过CC4.0协议的部分 , 还直接链接到原始数据库和论文地址 。
CC4.0协议是一种知识共享许可协议 , 是一种允许他人分发作品的公共版权许可 , 还有一种类似的 , MIT协议 。
作者此次选择的近2000个数据集都通过了这两项协议的 。 所以网站并不直接管理这些数据集 , 它只是一个数据集的「搬运工」 。

文章图片
在「类别分布」这一板块 , 首先会提示 , 没有标签、标签过多的图像数量 。

文章图片
然后根据不同的标签类别 , 显示各自的图像数量分布 。
推荐阅读
- 无趣科技谈|X2凭实力拿下冠军,京东手机周销量榜单出炉,Find
- 毛毛科技说|三星S20+出现“小米价”,总算等到了,三星扛不住了
- 简简科技|余承东称鸿蒙体验已达安卓7成多,鸿蒙手机新进展
- ITheat热点科技|2020 | 坚持创新 舒尔带来MXA710音频解决方案,SSOT
- 空心|招聘丨山西千沐云物联科技有限公司
- LeoGo科技|科沃斯除菌地宝N8和米家扫拖机器人横评——两款解放双手的精品
- 小绿叶子科技|半年跌1000元,适合捡漏,iPhoneSE2扛不住了
- 电科技|“吃鸡”手游老是瞄不准?不妨选这款游戏外设配件
- 科技日日说|realme真我X7全方位评测:不一样的颜值,不一样的体验!,原创
- 硅谷聊科技|就不愿再用华为、小米了?,答案确认了!为啥很多人用了iPhone后
