新闻是有分量的

当心!脱敏数据也会泄露隐私 专家建言加强监管

2017-07-12 19:13栏目:社会

   光明网记者 李政葳

   “一家商场小店盒饭25块钱一份,如果安装它们的App会三折优惠,后来发现这款App要求用户开通21项权限。”对于这次亲身经历,中国互联网协会法工委副秘书长胡钢感叹,能看通讯录,能打开录音录像,几乎掌控了我的手机。也就是说,顾客为了便宜十几块钱,就要把个人数据交给对方。

   “现在是大数据发展最好的时代,也是最糟糕的时代。”胡钢常这样说。大数据时代,数据蕴藏的巨大价值得以挖掘,同时也带来了隐私信息保护方面的难题——如何在实现大数据高效共享的同时保护敏感信息不被泄露。

在浙江大数据交易中心,网民体验大数据给生活带来的各种变化。(李政葳/摄)

   数据分类应该站在应用的层面

   今年5月,《贵阳市政府数据共享开放条例》正式实施,这是全国首部关于政府数据共享开放的地方性法规。“立法,可以促进政府数据走出高阁”逐渐成为业界共识。

   “对于数据的分类,如果只站在立法的层面并不科学,应该站在数据应用的层面。”在日前由人民网舆情监测室主办的一场互联网大数据安全研讨会上,中国政法大学互联网金融法律研究院院长李爱君所在的团队正在对大数据立法体系进行专项研究。在她看来,海量的数据包含着基础数据即小数据、个人信息等,大数据应该是在基础数据之外的非结构化的数据,并经过加工处理产生有价值的数据,也可以看做是基础数据的衍生品。

   对于很多商业公司来说,它们迫切需要精准了解消费者的兴趣、偏好、位置等,但在法律上,这样的传播是被严格禁止的。“所以,现在是大数据发展最快的时代、最好的时代,又是糟糕的时代。”胡钢认为,基于此,法律才要大规模、高力度地进行保护,才能体现以人民为中心的发展理念。

   在中国管理科学学会大数据专委会秘书长、大数据专家端木凌看来,开发大数据应用面临着“三问”:第一,数据从哪来;第二,怎么挖掘、怎么用;第三谁来买单。“最重要的是,因为有人买单才会有价值。”端木凌说,数据领域可能存在一些灰色地带,毕竟市场拓展太快,新情况层出不穷,立法还需要进一步跟进。

   城市基础设施领域需要统一数据标准

   哪些数据可以拿来用?端木凌认为,主要是生产过程中产生的数据,比如工业制造、旅游景区、环境监测等,这些与人们的隐私关系不大。

   作为业界一线从业者,大数据分析平台神策网络的副总裁杨岚钦说,在数据采集中他们常常遇到三个问题:第一,数据采集的完整性,即App端、web端到服务端采集过程中多通过公网传输,这个过程中一些第三方会恶意信息窃取;第二,数据采集隐私权问题,恶意第三方可能会截取一些数据,尤其是用户行为数据;第三,数据采集过程中的准确性问题,因为如果底层数据不准确,数据源质量没办法保证,就更不利于推动行业发展。

   “现有法律保障、政府监管以及对个人信息隐私保护的视角多集中在政企市场,也就是非工业类场景,但类似充电桩、污水管网等城市基础设施有大量传感器采集数据。在这方面行业法规、标准还是处于真空地带。”北京邮电大学信息与通信工程学院副教授高升认为,实际上,城市基础设施领域的市场需求量非常大,很少有技术方案能服务物联网领域,其数据采集、传输,甚至对于创新型应用的反向控制都很难解决。

   高升说,伴随这些产业的垄断化、集中化、集约化管理以及节能降耗的运营成了迫切选择,应该呼吁相关安全监管标准的配套。

   数据交叉分析也可能造成隐私泄露

   网上常见海量垃圾信息,如何识别数据本身的真实性与可靠性,也成为大数据安全的重要环节。“大数据正在开启智能时代,要实现行业健康发展、数据标准化,数据源的合规合法尤为重要。”人民在线副总经理杨松说。

   “从数据源头最重要的就是加强严控。”在端木凌看来,首先立法要跟上,再有就是全民的意识问题,“大数据领域出现行业壁垒,导致数据不能交流、共享,所以要从源头上把控好”。

   现在,源头的数据脱敏成为保护敏感信息的重要手段。杨松表示,数据脱敏是指对某些敏感信息通过脱敏规则进行数据变形,实现敏感隐私数据的可靠保护。“然而,从技术角度看,脱敏的数据不一定能够真正保证敏感信息不被泄露。”杨松坦言,一些数据从技术手段上如果能够进行一定的交叉对比,也可以定位到具体某个人的某些信息。因此,脱敏数据不一定能够真正做到个人隐私保护。