云体验师:AWS的云上数据湖方案怎么样?( 四 )


云体验师:AWS的云上数据湖方案怎么样?
本文插图
Club Factory是一家中国的跨境电商平台 , 它的业务需要做个性化推荐、内部运营分析以及供应商管理等场景 , 每天要处理15亿条行为日志 , 支撑180个活跃数据分析调度 , 每天需要把4000多个业务数据同步到AWS的数据仓库Redshift 。 AWS的数据湖满足了其业务增长需求 , 同时成本也有优化 , Club Factory还特别提到了Glue自动化ETL操作带来的便利性 。
AWS的数据湖方案也是不错的选择
云体验好就好在 , 它极大降低了安装部署方案的复杂性 , 云计算本身就是最佳推荐配置和方案 , 云上方案的安装部署配置能满足绝大多数人的需求 , 而且 , 在规模效应的加持下 , 成本会越来越有竞争力 。
从个人学习或者企业尝试新方案的角度讲 , 在不够充分了解一些新事物的时候 , 在云端走一遍是最快捷 , 最廉价 , 最高效的学习途径 。 当然 , 理论上技术爱好者自己搭建一些方案也是可行的 , 但企业生产环境容不下尝试性的方案 。
笔者一直以来都认为 , 云上的数据分析是数据分析的最佳实践环境 , 无论是企业还是个人 , 如果致力于从数据中挖掘价值 , 那么云上数据分析一定是绕不开的 。
云计算是讲究规模效应的 , 不是因为选择AWS的用户多AWS就一定好 , 用户多 , 规模大 , AWS可以用更先进的技术进行降本增效 , AWS的Nitro和即将推出的ARM服务器都是降本增效的典型例子 , 这让AWS的方案更有成本优势 。
云计算作为公开的服务形式 , 用户可以对其服务进行评价和反馈 , AWS的企业文化能接受这些反馈并作用于产品中 , AWS从不画大饼讲未来的Roadmap , 有的只是听需求 , 然后评估之后做产品方案 , 这会让产品和服务的体验变得越来越好 。
有鉴于这两点 , 我觉得AWS云计算是一个不错的选择 , 数据湖方案里 , AWS的数据湖方案也是不错的选择 。


推荐阅读