|数据版本化:如何开始使用DVC控制数据版本?( 二 )
有时 , 如果我们甚至不能检索所使用的精确数据集 , 那么重现实验结果可能有点令人畏惧 。 数据版本控制可以缓解这些问题 , 并使机器学习解决方案的开发过程更加简单、有组织和可重复 。
3.合规及审计
一些隐私法规 , 如GDPR , 已经要求公司和组织展示可使用数据源的遵从性和历史记录 。 跟踪版本控制工具提供的数据版本的能力是使公司的数据源为遵从性做好准备的第一步 , 也是维护围绕数据的强大和健壮的审计培训和风险管理流程的必要步骤 。
4.协调软件和数据科学团队
有时候 , 协调使用同一种语言的数据科学和软件团队非常具有挑战性 , 高度依赖团队之间交互所涉及的配置文件 。 开始将一些好的实践从软件实现到数据科学过程中 , 不仅可以帮助调整所涉及的团队之间的工作 , 而且还可以加速解决方案的开发和集成 。
本文插图
图源:unsplash
数据科学必须产品化 , 其中有太多的可变元素——比如数据 。 数据科学应用程序的版本控制概念可以用多种可能的方式解释 , 从模型到数据版本控制 。 本文旨在介绍数据科学团队对数据版本化的重要性和好处 , 但是数据科学家还有更多方面需要注意 , 密切关注持续交付原则 , 对于基于机器学习的解决方案的成功非常重要 。
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
【|数据版本化:如何开始使用DVC控制数据版本?】如转载 , 请后台留言 , 遵守转载规范
推荐阅读
- 团团站|团团站——实体门店如何通过朋友圈拓展客户?
- 漏洞|Android 9.0等低版本系统被发现存在StrandHogg 2.0漏洞
- 科学|陈根:交织着“记”与“忘”的记忆,是如何发生的?
- 暗淡青春|一根数据线居然卖354元
- 电脑使用技巧|Word、PPT中如何制作高大上的插图
- 华为开发者联盟|华为课堂|华为帐号如何保护您的帐号安全?
- 潮黑|小辣椒要移花接木,金立要借尸还魂,抄袭现象如何破
- 数据|10分钟,做一份数据可视化分析报表
- 技术编程|人工智能在大视频运维中如何实现CDN硬盘故障预测?
- |客户与员工如何实现精细化管理
