『科技正能量』云测数据:新基建时代的“AI数据雄兵”
几年前 , AlphaGo瞬间点燃了AI的激情与梦想 , 巨大的光环把AI推向了市场的风口 。 之后的几年国内的AI创业虽然几经起落 , 但也逐渐走向成熟 。 AI产业将逐渐褪去浪漫主义的“光环” , 走向实用主义的落地 。
在3月4日 , 国家决策层提出要发力于科技端的基础设施建设 , 人工智能成为“新基建”七大版块中的重要一项 。 “新基建”的呼啸而至 , 显然为中国AI产业的稳步推进起到了关键的作用 。
本文插图
简单回顾一下AI的发展历程 , AI的三大要素是指算法、算力和数据 。 人工智能学科源起于1956年 , 之后在半个世纪的发展中几乎停滞不前 , 算力和数据的发展远远落后于算法 , 是当时制约AI发展的主要因素 。 而从2000互联网时代之后 , 因为云计算的逐渐普及 , 算力的制约也被打破 。
所以 , 下一阶段AI产业发展的关键 , 其实是数据 , 基于行业场景化的AI数据 , 将是推动AI产业为新基建赋能的重要力量 。 新基建下的AI产业化“催化剂”
大数据技术已经发展了很多年 , 一些科技企业也特别喜欢标榜 , 自己已拥有了多庞大的数据量 。 但这些所谓的大量数据 , 对AI的实际价值 , 到底有多大?
我们知道 , 真正改变当代AI产业的技术是深度学习 。 从2009年的ImageNet数据集发布算起 , 深度学习时代已经有超过10年的历史 。 对深度学习而言 , 没有标注的数据 , 就没有 AI 算法模型 。 而模型迭代和调整 , 则需要更多的数据 。 越是准确的算法 , 就越依赖于大量高质量的标注数据 。
由此可见 , AI产业进一步发展的关键瓶颈 , 就是高质量的标注数据 。
从场景化的角度 , 以自动驾驶为例:第一步是利用车上的摄像头或激光雷达获取周围的数据;第二步 , 由人工对这些数据进行标注;最后一步 , 这些标注好的数据被用于到AI模型训练 , 帮助汽车更好的感知道路场景 , 为智能驾驶技术的发展保驾护航 。 在这个流程当中 , 被标注好的高质量数据像是燃料 , 更像是AI走向落地的基石 。
本文插图
新基建当中提到的AI , 其实更倾向于AI与行业场景的结合 , 更看重智能化的落地 。 尤其在数字化转型的背景下 , 百行百业对智能化的需求爆发的很快 , 各种AI基础设施和解决方案的发展也极为迅速 。
而在AI应用实践中 , 优质的AI数据对于行业解决方案的价值提升就会更为明显 , 高质量的AI数据将最大限度地提升人工智能应用的效率 。 所以 , 数据之于AI产业的意义 , 就在于可以最大程度上提升AI在行业落地的效率与稳定 , 进而推动新基建的落地 , 可见其意义之深远 。 数据标注行业的领头羊
看似简单的数据标注 , 其实蕴含了巨大的市场机会 。
2015年 , 成立于旧金山的Scale AI , 在整个AI产业当中或许是一个名不见经传的小公司 。 令人意外的是三年多的时间 , 它就获得了1亿美元的C轮融资 , 估值超过10亿美元 , 成为了当之无愧的独角兽 。 从Scale AI备受关注的背后 , 即可见数据标注行业的未来 。
在中国市场 , 过去的数据标注行业曾长期处于粗放的发展模式 , 数据粗制、混乱、复用的情况屡见不鲜;但随着AI与各个产业结合得愈加紧密 , AI商业化程度进入新的高度 , 人工智能对数据标注的质量提出了更高要求 , 数据小作坊的模式已不适用于AI产业化落地前夕的数据需求 , 而在这其中 , 定制化、场景化的高质量数据服务更是成为其中关键 。 据《2019年中国人工智能基础数据服务行业白皮书》统计 , 早在2018年 , 高质量的数据资源定制服务就占中国人工智能基础数据服务的86% , 可见优质数据市场之潜力巨大 。
推荐阅读
- 「定焦爱科技」3拯救低电量焦虑症,超大电池搭配超快闪充,续航出色的iQOO
- #科技小李#小屏爱好者嗨起来,4.7寸新iPhone确认四月发布,价格是大亮点!,原创
- 中国网科技@撤出液晶面板生产,三星将关闭两座工厂
- #即科技#107国赞同票作废!,想“加入”联合国?中国使用一票否决
- 【腾讯科技】全球应用市场第一季度大爆发:花费达234亿美元创纪录 时长增20%
- 「百度」百度发布直播搜索大数据:疫情下电商及知识类直播增速明显
- 即科技■决定权掌握在中国手,?联合国五常将变六常?此国获美俄一致力挺
- [笔记本电脑]乙辰科技正式发布首款WiFi6新品:北斗II号分布式无线路由器
- 『极速聊科技』目前仅剩10余人,暴风集团:员工持续大量流失
- 【科技生活快报】普京:已与欧佩克和美国就石油价格下跌问题进行讨论
