科普|数据脱敏怎么选
安华金和 安华金和 2020-03-23
作者 | 安华金和

个人隐私安全这个话题如今俨然已经不是一个新话题,而是一个热话题,究其缘由一是国家对于个人隐私安全越来越重视,相继出台了一系列政策法规;其次是大家对于自己个人隐私安全的意识加强;还有一个重要原因是各种个人隐私泄漏事件为各类组织自身带来的损失越来越大,这些损失即有直接的经济损失,更有对品牌形象的间接影响。这些都促使各类组织越来越重视个人隐私数据的保护,数据脱敏产品作为个人隐私保护的一款利器,已经被越来越多的组织采用。那么面对市面上越来越多的数据脱敏产品,组织要如何区分?又如何选择一款适合自己的数据脱敏产品呢?本文将从静态脱敏与动态脱敏的应用场景、基本功能、附加功能来详细介绍,为大家提供可借鉴的建议。

一、怎么选择脱敏技术

数据脱敏技术一般分为动态脱敏和静态脱敏两种,这两种技术适用于不同的脱敏场景:

静态脱敏一般用于将生产库中的数据导出外发使用场景,如用户生产库中的数据需要拿到测试、开发、分析等第三方使用环境中。 

动态脱敏适用于不脱离生产环境,对敏感数据的查询和调用结果进行实时脱敏。如客服系统,客服人员需要实时的调用生产库里的数据进行查询、外呼等操作,但是客服人员没有必要看到用户所有的真实信息,那么就需要对查询返回的结果实时脱敏,让客服人员看到部分数据但又不影响对业务的操作。还比如数据运维管理、应用访问,这些场景不需要对生产数据库中的数据进行任何改变,但需依据用户的角色、职责和权限的不同看到不同级别的脱敏数据。

二、数据脱敏应该具备的基本功能

无论是静态脱敏还是动态脱敏都应该具备以下的基本功能:

1、敏感数据发现:只有定位到敏感数据存在哪,才能完成脱敏任务。所以无论静态还是动态脱敏产品都应该具备敏感数据发现功能。比如能够按照用户指定的一部分敏感数据或预定义的敏感数据特征,在执行任务过程中对抽取的数据进行自动的识别并发现敏感数据。

2、丰富的脱敏算法:脱敏产品应该具备丰富的脱敏算法以满足不同的脱敏场景需求,例如同义替换、部分数据遮蔽、混合屏蔽、确定性屏蔽等脱敏算法,同时支持用户自定义脱敏算法以及按自定义函数定义脱敏算法。

三、好的数据脱敏还应该具备什么功能

1、一款好的静态脱敏产品应具备以下功能:

确保数据脱敏有效性:保证脱敏后的数据能够准确反映原始数据的业务属性和数据分布特征,例如对于原始数据中的姓名、地址、病症、企业名称等信息需要在脱敏后仍然具有可读性;脱敏后的数据需要满足业务系统的数据规则,能够正确的通过业务系统的数据有效性验证,如身份证号、银行卡号的校验码,生日数据的区间,有效的发卡行信息,年龄与出生日期的匹配等。

保留数据关联性:脱敏后的数据应能满足业务系统的数据关系特征,严格保留原有的数据关系;例如身份证号在多个表中出现,需要保证这些数据经过脱敏后也是一样的。另外,对于具有时间序列关系的数据,需要保证每个日期脱敏后仍然能够保持原有的时间序列。

保证高效脱敏:高端场景下的数据量很大,包括表数量多,单表数据多,每日增量数据多等等。为了能够尽可能节省人工劳动成本,脱敏产品的性能一定要高,最好能够支持增量数据定期自动执行脱敏。

2、一款好的动态脱敏产品应该具备以下功能:

全面的权控体系:在实际场景中通常会涉多个数据库的监控和脱敏,这些数据库一般都关联归属于不同业务,甚至还存在代理运维第三方业务的情况。所以针对这种复杂的人员结构以及复杂的业务场景,动态脱敏产品应具备根据不同数据库组、用户、角色实现不同的数据脱敏能力。

高性能脱敏能力:动态脱敏产品的使用场景决定了需要保证脱敏的及时性和高效性。最好能够保证在脱敏字段多且结果集庞大的情况下控制数据访问性能下降不超过10%。

完备的容灾机制:动态脱敏产品一般会采用串联部署模式,为防止异常断电、设备迁移等外界因素导致设备不能正常启用时,动态脱敏应该可以通过HA主备来应对风险的发生。通过系统容灾管理配置,在异常发生导致其中一台设备不可用时,动态脱敏设备可以自动将策略、会话等信息同步给备机,并且继续实现脱敏、防护等作用,快速的主备切换几乎不会延误用户的业务操作以及数据库使用。

四、相关链接
1、 数据脱敏相关技术

▪ 数据脱敏的主要方式
▪ 数据库静态脱敏是什么?
▪ 静态脱敏集群部署架构下的应用探索
▪ 动态数据脱敏不同技术路线对比
▪ 国内动态脱敏技术演进技术探讨
▪ 敏感数据的“用”、“护”之道-静态脱敏
▪ 敏感数据的“用”、“护”之道-动态脱敏

2、 数据脱敏系统怎么选

▪ 好的静态数据脱敏产品应具备哪些能力?
▪ DMS数据脱敏系统:满足多场景需求
▪ 银行数据脱敏场景需求与解决思路
▪ 静态脱敏与动态脱敏的区别
▪ 静态脱敏的部署模式
▪ 静态脱敏的应用场景及特点

分享到

点赞(0)

说点什么

全部评论