(原标题:苹果新手机或具窥私技术:能分析用户行为,不会违背隐私承诺)
“苹果从不收集用户个人档案,但一个越来越不容忽视的现实是,收集用户信息对于制作优秀软件非常关键,尤其是在大数据分析和机器学习的时代。”
在上周召开的苹果世界开发展大会上,苹果公司高级副总裁克雷格·费德里希(Craig Federighi)在主旨演讲中,道出了许多软件提供商共同面临的两难选择。
据《华尔街日报》报道,针对上述问题,费德里希表示,苹果公司正着手研发一种新的技术,既能够分析用户行为,又不违背公司的隐私承诺。而这项技术最快将被应用在今年秋季发布的苹果新一代手机(iPhone 7)和平板电脑上。
据介绍,该项技术被称作“差分隐私”(differential privacy),可以帮助该技术公司的工程师发现各类用户使用他们的设备时的行为模式。这项技术会将不准确的信息添加到苹果公司收集的数据中,通过这种做法,苹果的算法能够提取有用的分析,同时任何人想将准确的数据和单独用户联系起来却非常困难。
宾夕法尼亚州大学计算机科学教授阿隆·罗夫(Aaron Roth)指出,差分隐私绝对不是简单地将用户信息匿名化处理。因为这样简单的处理方式在此前已经被证明是无效的。2007年,Netflix发布了大量用户的电影点评,其中隐去了用户的名字和其他相关的个人细节,只保留了他们在Netflix上的点评,希望从而优化网站的推荐功能。但研究人员很快通过对Netflix数据与IMDB上的公众点评数据进行相互对照,从中找出两个网站之间相似的点评推荐,从而向Netflix本应匿名的数据库中添加用户的名字。
按照苹果公司的观点,差分隐私保护是一个统计学概念,指的是尽可能多地了解特定的团体,同时尽可能少地了解其中的任何个体。为了模糊处理个人的身份,差分隐私保护向个人使用习惯的小样本中增加数学噪声。随着越来越多人呈现出相同的使用习惯,一般性模式浮现,从而有利于明确用户体验并帮助进行改善。换句话说,差分隐私就是一项以避免在数据与特定个人之间建立联系为前提的数据处理方案。
在理论上,黑客或者情报机构是不能够从经过该技术处理的数据中提取个体信息的。但苹果是否能严格遵照差分隐私保护技术,来全面保护客户的隐私,又将另当别论。
据苹果透露,目前公司在利用“差分隐私”技术上的短期雄心是有限的。公司计划利用这项技术,分析消费者在手机上,如何使用表情符号或俚语表达,什么搜索请求应该弹出指向应用的“深度链接”而不是网页,并会使用该技术改进公司的“笔记”软件。对用户而言,有了这样的技术,譬如在键盘打字中,使用者可能将能够快速打出最新的网络用语,哪怕自己以前没有用过。
然而从长期来看,“差分隐私”可能帮助苹果跟追赶上谷歌公司等竞争者,这些竞争者在收集用户数据方面更积极,并有用这些数据改进它们图像和语音识别项目方面的先例。
目前,学界对于苹果的“差分隐私”技术所持的态度并不相同。
据罗夫透露,他在苹果公司的授权下,已经部分“快速浏览”了该公司对这种数学技术的执行情况。虽然他表示不便对该技术具体情况做出评价,但认为“他们现在做的是正确的。”
来自约翰霍普金斯大学的密码学教授马修·格林(Matthew Green),则持谨慎态度,他指出差分隐私不仅未经严格检验,还可能存在危险。“问题在于(苹果所使用的)数据类型、测量方式和具体用途,”格林向媒体说,“这的确是个很棒的想法,但我从未真正见过它被应用。它最终会成为数据准确性和隐私之间的折衷。而隐私性的提高必然会伴随着准确性的降低。”