什么是“差异隐私”,它如何使我的数据保持匿名?

苹果将他们的声誉押在确保它从你那里收集的数据保持隐私上。多么?。通过使用一种叫做“差异隐私”的东西。

什么是差异隐私?

苹果是这样解释的:

差异隐私背后的哲学是这样的:任何一个用户的设备,无论是iPhone、iPad还是Mac,如果他的设备添加了计算来生成更大的聚合数据池(从不同的较小图片形成的大图),都不应该被透露为来源,更不用说他们贡献了什么数据。

苹果也不是唯一一家这样做的公司-谷歌和微软甚至更早就开始使用它了。但苹果在2016年的WWDC主旨演讲中详细讨论了这一点,从而使其变得流行起来。

那么,你会问,这与其他匿名数据有什么不同?嗯,如果你对一个人有足够的了解,匿名数据仍然可以用来推断个人信息。

比方说,黑客可以访问一个匿名数据库,该数据库可以泄露公司的工资单。比方说,他们也知道员工X正在搬迁到另一个地区。然后,黑客只需在员工X搬家之前和之后查询数据库,就可以很容易地推断出他的收入。

为了保护员工X的敏感信息,Differential Privacy用数学上的“噪音”和其他技术对数据进行了修改,如果你查询数据库,你只会收到员工X的工资(或其他任何人)的近似值。

因此,他的隐私被保护起来,因为他提供的数据和添加到其中的噪音之间的“不同”,所以它足够模糊,几乎不可能知道你正在查看的数据是否真的是某个特定个人的数据。

苹果的差别隐私是如何工作的?

差异隐私是一个相对较新的概念,但其想法是,它可以根据用户的数据给公司带来敏锐的洞察力,而不需要知道这些数据到底说了什么,也不知道它是从谁那里获得的。

例如,苹果依赖于三个组件来利用差分隐私在您的Mac或iOS设备上工作:散列、次采样和噪声注入。

散列算法获取文本字符串,并将其转换为固定长度的较短的值,然后将这些密钥混合成不可逆转的随机唯一字符串或“散列”。这会模糊你的数据,所以移动设备不会以原始形式存储任何数据。

二次抽样意味着,苹果将只使用较小的样本,而不是收集一个人键入的每个单词。例如,假设你与一位朋友进行了一次长时间的短信交谈,慷慨地使用了表情符号。子抽样可能只使用苹果感兴趣的部分,比如表情符号,而不是收集整个对话。

最后,你的设备会注入噪音,将随机数据添加到原始数据集中,以使其更加模糊。这意味着苹果得到的结果被稍微掩饰了一下,因此不太准确。

所有这一切都发生在你的移动设备上,所以在它被发送到云中供苹果分析之前,它已经被缩短、混淆、采样和模糊。

苹果的差异隐私在哪里使用?

苹果可能希望收集数据以改善其应用程序和服务的情况多种多样。不过,目前苹果只在四个特定领域使用了差异隐私保护(Differential Privacy)。

当有足够多的人用特定的表情符号替换一个单词时,它就会成为对每个人的建议。 当有足够多的新单词被添加到足够多的地方词典被认为是司空见惯的时候,苹果公司也会将其添加到其他所有人的词典中。 你可以在Spotlight中使用搜索词,然后它会提供应用程序建议,并在所述应用程序中打开该链接,或者允许你从App Store安装它。例如,假设你搜索“星际迷航”,它会推荐IMDB应用。打开或安装IMDB应用程序的人越多,它出现在每个人的搜索结果中的次数就越多。 它将为笔记中的查找提示提供更准确的结果。例如,假设您有一个包含单词“Apple”的笔记。你进行一次查找搜索,它不仅会给出字典定义的结果,还会给出苹果的网站、苹果商店的位置等等的结果。据推测,点击某些结果的人越多,他们出现在其他人的搜索结果中的频率就越高,频率也就越高。

让我们以表情符号为例。在iOS10中,苹果在iMessage上引入了新的表情符号替换功能。输入“爱”这个词,你可以用一个心的表情符号来代替它。输入单词“狗”--你猜对了--你可以用一个狗表情符号来代替它。

同样,你的iPhone也可以预测你想要什么表情符号,即使你输入了一条信息“我要遛狗”,你的iPhone也会很有帮助地建议你使用狗表情符号。

因此,苹果收集了它收集的所有这些小片段的iMessage数据,将它们作为一个整体进行检查,并可以从人们在什么地方打字以及在什么背景下打字推断出模式。这意味着你的智能iPhone不能给你更聪明的选择,因为它受益于所有其他人创建的文本对话,并认为“这可能就是你想要的表情符号。”

(Emoji的)需要一个村庄。

差异隐私的缺点是它在小样本中不能提供准确的结果。它的力量在于使特定数据变得模糊,因此不能将其归因于任何一个用户。为了让它正常工作,许多用户必须参与进来。

这有点像是非常近距离地看一张位图照片。如果你只看几个部分,你不会看到它是什么,但是当你退后一步看整个东西的时候,照片就会变得更加清晰和清晰,即使它不是超高分辨率的。

因此,为了改善表情符号的替换和预测(以及其他方面),苹果需要从世界各地收集iPhone和Mac的数据,以便越来越清楚地了解人们在做什么,从而改进其应用程序和服务。苹果还会求助于所有这些随机、嘈杂、众包的数据,并挖掘这些数据来寻找模式-比如有多少用户正在使用桃子表情符号而不是“屁股”。

因此,差异隐私的力量依赖于苹果能够检查大量的聚合数据,同时确保它不会更明智地知道是谁向他们发送了这些数据。

如何在iOS和MacOS中选择退出差异隐私

如果你仍然不相信差别隐私是适合你的,那么你就走运了。您可以直接从设备的安全设置中选择退出。

在iOS设备上,点击打开“设置”,然后点击“隐私”。

在隐私屏幕上,点击“Diagnostics&Usage”(诊断和使用)。

最后,在Diagnostics&Usage(诊断和使用)屏幕上,点击“Do‘t Send”(不发送)。

在MacOS上,打开系统首选项,然后单击“安全与隐私”。

在安全和隐私首选项中,单击“隐私”选项卡,然后确保取消选中“向苹果发送诊断和使用数据”。请注意,您需要单击左下角的锁定图标并输入您的系统密码,然后才能进行此更改。

显然,与这种简化的解释相比,差异隐私在理论和应用上都有更多的内容。它的主要部分很大程度上依赖于一些严肃的数学,因此,它可能会变得相当沉重和复杂。

然而,希望这能让你了解它的工作原理,并让你对公司收集某些数据更有信心,而不用担心被识别。

相关文章