DT|【数据安全之全景图】开篇之作:DT时代的数据安全核心三要素( 二 )


海量多样要素
随着DT时代的大数据技术持续成熟和普及,如何应对日益显著的大数据安全风险,首先需要明确大数据安全内涵。在大数据时代下,数字化组织对来自内部外部多种数据源进行采集和汇聚存储,并通过分布式处理技术及机器学习技术对数据进行组织、存储和分析处理,目的是为了从海量数据中挖掘潜在价值,驱动数字化组织的业务价值实现,实现组织的数字化战略。因此数据管理具有分布式、无中心服务器、多组织协调等特点,数据安全管理面临新的挑战。理解大数据安全需要从生命周期、架构和关联上下文三个维度明确大数据安全相关的技术和机制。
 DT|【数据安全之全景图】开篇之作:DT时代的数据安全核心三要素
文章图片
一、生命周期维度。传统的数据安全是假设在有比较清晰的安全边界下讨论数据分类分级、数据组织、存储和访问权限,以及数据在传输和存储中的加密等保护技术,而大数据安全需要从数据生命周期角度考虑数据从产生,经过数据采集、数据传输、数据存储、数据处理(包括计算、分析、可视化等)、数据交换,直至数据销毁等各阶段演变过程中的数据安全需求。因此必须考虑处于生命周期不同阶段数据在不同安全域间交换与共享、数据发布、不可信主体之间的数据安全保护技术与机制需求。
二、架构维度。大数据生态系统是由系统协调者、数据提供者、大数据应用提供者、大数据平台(框架)提供者和数据消费者等5个逻辑功能构件组成。因此从横向来看,大数据安全覆盖数据预处理、数据处理和分析、数据可视化等数据增值活动空间相关的安全技术与机制,从纵向看,大数据安全覆盖分布式文件存储、大数据管理平台和不同数据处理类型的分布式计算相关的分布式节点间可信计算、多版本数据一致性、数据互操性规范等安全技术和机制。
三、关联上下文维度。在数字化组织环境下,大数据既包括原始采集的未经加工的无语义的微观数据集,也包括经过加工处理得到的各种汇总统计的宏观数据,还包括驱动组织决策相关的规则等知识数据集和由大数据分析驱动产生的各种价值数据集等。因此大数据安全需要考虑由多源数据派生、聚合、关联分析等数据分析过程中的数据资源操作安全策略与规范,也需要考虑数据分析结果输出的安全授权控制机制,并采取必要的技术手段和管控措施保证共享数据分析结果不泄露个人信息、重要业务数据等敏感信息。
开放流动要素
数据已经成为DT时代数字化组织的核心竞争力,而数据作为一种新的生产要素,只有充分开放流动起来才能产生价值。当组织的数据化转型进程进入深水区,组织内部以及不同组织之间的数据开放流动比以往任何时候都全面和高频,比如数字政务领域的线上政务业务办理的业务场景,通过实现“数据多跑路群众少跑腿”来提升用户体验,比如金融科技领域的开放银行,开放银行是银行触达长尾用户的重要路径,利用开放 API 等技术实现银行与第三方机构间的数据开放共享、银行服务与产品的即插即用,进而提升用户体验,共建开放的泛银行生态系统。
 DT|【数据安全之全景图】开篇之作:DT时代的数据安全核心三要素
文章图片
正是因为在这种全面高频数据开放流动的背景下,数据安全和隐私保护所面临的风险挑战成倍增长,在传统静态的数据安全保护时代,更关注数据在存储和外发这两个环节被非授权的获取,而数据的开放流动和使用往往被认为是被信任的用户、实体和应用通过授权合法的访问行为,并不在传统数据安全保护的体系设计内。而在DT时代,数据开放流动到基层员工、外包业务人员、合作伙伴等,是基于业务需求角度的授权而非基于安全可信角度的授权。黑灰产就会利用数据开放流动过程中的脆弱点,通过网络爬虫、定向植入木马、社会工程等组合攻击方法在数据开放流动的业务应用层窃取各种数据,包括业务敏感数据、个人敏感信息、间接个人关联识别信息等,比如热订单数据(交易完成后短时间内)、个人姓名/手机号码/身份证号码、C端个人用户属性数据(注册时间、头像、评论信息等)等,这里重点提下间接个人关联识别信息,由于数据之间彼此存在着关联性,一些原本在通常习惯下觉得并不重要的数据,极有可能成为对黑灰产有用的辅助分析数据。
对于数据开放流动带来的风险挑战,可以通过以下几个思路来考虑解决之道。第一,基于最小数据权限原则,由业务部门先判断该业务正常运作情况下哪些数据是必须开放流动的?哪些是没必要的?最后梳理出满足业务需要的最小数据范围;第二,业务处理是否需要明文的个人信息,匿名的数据是否满足要求;第三,是否有完善的数据访问行为监控和异常行为分析的安全能力;第四,是否有完善的敏感数据溯源的安全能力;第五,评估合作伙伴组织的安全资质和网络信息安全建设水平如何;最后再考虑是否可应用同态加密、安全多方隐私计算、区块链等新一代安全技术,在充分保证数据开放流动效率水平的前提下,实现可控的数据安全保障。
三要素总结
价值,遵循二八原则,重点监测保护高价值数据,通过数据分类分级梳理识别高价值数据;
海量,从生命周期、架构和关联上下文三个维度明确海量多样大数据安全相关的技术和机制;


推荐阅读