先后参与集团OSS4.0、集团集中化经分、内蒙古大数据平台、上海统一汇聚平台等大型项目建设,参与《中国移动大数据安全防护技术实施指南》规范撰写,负责Hadoop平台安全技术研究项目、“门神计划”防数据泄漏系统项目等多个安全项目。为中国移动集团公司技术咨询委员会安全领域专家组成员。
关于大数据安全的思考
中移软件多年来一直致力于大数据平台建设,为中国移动提供大数据平台建设和服务能力。
在建设实践过程中,我们一直在思考大数据平台安全与传统数据安全的区别。从本身特征来看,大数据平台数据量大、数据涉敏,同时大数据平台底层为开源组件。从外部环境来看,GDPR和网络安全法都关注个人隐私数据,最近频发的安全事件也注意是数据泄露事件。
此前平台建设实践更多的关注于平台本身,我们做了漏洞扫描工具等,但是都是独立于数据采集、存储、处理、共享过程之外的,要真正保障大数据平台数据的安全,必须关注数据本身,关注数据生命周期,也就必须与数据采集、存储、处理、共享完全结合,不能游离在大数据处理流程之外。
全生命周期数据安全防护平台
我们将数据全生命周期精简定义为“采集传输-存储处理-数据共享”三大部分流程,其中数据采集过程涉及平台外与平台内之间的数据交互,存储处理为平台内处理过程,数据共享为平台内与平台外之间的数据交互。同时对全过程通过安全态势感知平台进行检测和预警。
图1 数据全生命周期
数据采集传输安全防护
配置采集数据源、配置采集流程(含建目标表)、调度监控采集流程、采集数据传输四步。
主要通过采集白名单配置、数据源操作权限管理等手段进行安全防护
主要通过事前敏感字段标注、安全级别设置、静态脱敏等方式进行安全防护
通过应用程序账号认证、流程监控告警、资源相互隔离等方式保障
通过传输加密等方式保障
图2 数据采集传输过程-静态脱敏
数据存储处理安全防护
敏感数据存储是大数据安全的难题。全生命周数据安全防护平台提供透明加密和数据完整性检查两种解决方案,加固数据存储环节,提高数据存储安全性。但是加密存储对平台性能影响大,同时对使用造成较大影响,因此一般敏感级别的数据不建议加密存储。
中移软件全生命周期数据安全防护平台更重视使用过程的安全,使用过程分4种不同场景进行防护。以数据使用场景 “用户ABC对A表X字段进行查询操作”为例,通过不同的技术手段,实现4种不同层级的使用防护。
对不起,您对A表的访问权限仅限访问Y字段,无权访问X字段。该场景使用行列细粒度权限管控技术实现细粒度数据权限管控。