读芯术■实操指南:用谷歌AutoML构建图像分类模型
全文共2710字 , 预计学习时长8分钟
本文插图
如何用谷歌AutoML创建单标签分类模型?
今天我们将使用一个来自generated.photos的AI生成的人脸数据集 , 训练该算法 , 使其能够判断人脸是男是女 , 然后将模型部署到云端 , 并且建立算法的网页版 。一起来试试吧!
获得标签
OK , 现在开始吧!先来看看将用于分类的数据 。 总计有2000张人脸照片 。
本文插图
难以相信这些人脸都不是真的!现在 , 需要获得真值 (ground truth) 标签来训练算法 。 可以在wao.ai网站上新建一个图片分类的任务来快速获取标签 。任务完成后就可以得到一个包含真值标签的CSV文件
建立项目
是时候打开谷歌AutoML了 。 本节内容为在谷歌AutoML上新建数据集并开始训练模型 。如果读者还没有账号 , 请在谷歌云端平台(Google CloudPlatform, GCP) 注册账户,然后建立一个新项目 。
本文插图
新建项目之后 , 可以通过侧边栏或者顶端搜索栏进入谷歌AutoML 。 读者可能需要启用一些API , 完成账单设置 , GCP会引导用户完成这一过程 。
本文插图
接下来 , 点击“图像分类”(Image Classification)版块的“开始”(Get Started) , 进入数据集界面 。
本文插图
进入数据集界面 , 该界面中 , 点击“创建新的数据集”(Create NewDataset) , 填写细节设置以训练数据集 。
本文插图
格式化输入数据
现在才能真正把数据输入到谷歌云端平台 。 所有的数据都必须存入GCP存储桶(Storage Bucket) 中 。 由于数据集过大 , 浏览器界面可能无法正常运行 。不过 , GCP命令行工具应该可以正常运行 。点击cloud.google.com/sdk/安装谷歌云SDK(包含命令行工具) 。现在只需执行gsutil cp -rpath/to/faces gs://YOUR_BUCKET/faces将文件移动到存储桶 。 请务必将YOUR_BUCKET更改为自己的存储桶名(下方截屏中可以看到笔者的存储桶名是 woven-icon-263815-vcm) 。
本文插图
接下来 , 把wao.ai的真值标签CSV文件转换为AutoML要求的CSV输出 。原始的CSV文件是这样的:
本文插图
为了让谷歌AutoML便于使用 , 需进行如下调整:
本文插图
笔者在ipython终端中用pandas库的DataFrame完成了这一操作 , 如下图所示:
本文插图
本文插图
数据集创建完成
现在有了符合谷歌AutoML格式要求的CSV文件 , 可以完成数据集的创建了 。将新创建的CSV文件上传到存储桶 , 在 “导入数据集”(Import Dataset)界面中选中它 。
推荐阅读
- 晨株洲▲高速免费!株洲高速警察发布清明假期出行指南
- 远程运维方案选型指南——官网可下载的ZStack私有云平台
- 「汽车大咖」平桥勤务大队两公布一提示丨清明出行指南
- 人民网:清明出行防疫指南:北京太子峪陵园 上海滨海古园热度高
- #人民网#清明节准备去祭祖?先看看这份防病养生指南
- 『绍兴体育』你要的体育消费指南来了!,绍兴首轮体育消费券4月3日开抢
- 「什么值得买」业内人总结的内存条终极选购指南—厂商篇
- 『镇江城事809』单反相机入门指南
- 「慢慢买比价」鼠标选购防坑指南丨“人体工程学”有多厉害?其实并不适合你
- 『历史每日揭秘』日产逍客和Jeep指南者应该如何取舍,最近打算买车
