数据隐私与数据治理:概念与技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 数据隐私的定义与特征

在思考大数据隐私保护问题之前,我们首先需要了解数据隐私的特征。本节将从数据隐私的定义出发,说明数据隐私的三个基本特征,并进一步探讨数据隐私和信息安全的区别。

2.2.1 数据隐私的定义

数据隐私指个人、机构等实体不希望被外界知晓的信息,如个人的薪资、医疗记录等。图2.1描述了与个人相关的隐私信息。在具体场景中,数据隐私的具体定义会随着数据与数据拥有者的不同而发生改变。例如,保守的人会将社交关系视为隐私,而开放的人愿意披露自己的社交关系。

2.2.2 数据隐私的基本特征

基于上述数据隐私定义,可以发现数据隐私具有三个基本特征。

• 数据隐私的主体是个人或组织团体。

• 数据隐私的客体是个人信息或团体信息。

• 数据隐私的内容是主体不愿意泄露的事实或者行为。

此外,在大数据背景下,由于大数据具有大规模性、多样性与高速性的独有特征,数据隐私还具有边界难以鉴定的特征。

2.2.3 数据隐私和信息安全的区别

2012年1月,奥巴马在消费者隐私条例草案发布会上说:“目前比以往任何时候更需要隐私,大数据时代更加如此。”[1]先前有文献从信息安全的角度阐述大数据管理问题[2],实际上,数据隐私和信息安全存在一定的区别。

1.二者定义的区别

数据隐私是指个人、组织机构等实体不愿意被外部知道的信息,比如,个人的行为模式、位置信息、兴趣爱好、健康状况、公司的财务状况等,如图2.1所示。数据隐私主要涉及数据的模糊性、隐私性、可用性。

图2.1 与个人相关的隐私信息

信息安全是指信息及信息系统免受未经授权的访问。未经授权的操作包括非法使用、披露、破坏、修改、记录及销毁等。信息安全主要涉及数据的机密性、完整性、可用性。

2.二者实施技术的区别

信息安全的实施技术包括访问控制和密码学;而数据隐私的实施技术包括模糊化、匿名化、差分隐私(differential privacy)以及加密等。虽然信息安全技术能够保证基础设施、通信与访问过程数据的安全性,但是数据的隐私还有可能被泄露。例如,一个被授权的恶意用户可以误用Alice的数据并将其与其他数据融合,这些操作可能会泄露Alice的隐私。虽然数据隐私和信息安全存在以上区别,但是二者的最终目的是一致的,即数据能够被私密地、安全地访问和分析。