差分隐私,hey siri这个功能会不会有隐私泄露的隐患

欲戴王冠必承其重,就像明星享受镁光灯的代价,就是隐私权的让渡,因此对于动辄喜提上千亿美元市值的科技巨头们,所付出的代价,无疑就是被外界放在放大镜下挑剔差分隐私。在此前《华尔街日报》曝光了苹果在App Store搜索中有意偏袒自家应用之后,近日英国《卫报》的报道称,Siri与亚马逊Alexa和谷歌Assistant一样,也存在偷听用户对话并录音的情况。

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

据这一报道显示,苹果的前外包商员工爆料称,苹果会将上传至服务器的Siri对话录音发送给外包商,用以对Siri的表现进行评价,并分析其回答是否准确等。但需要注意的是,这些Siri的对话录音中还包含了与用户私生活关系极为紧密的敏感信息,其中例如医患交流、商务谈判,乃至不可描述行为等等。

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

苹果的人设看上去要塌了

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

受限于苹果内部极其严格的保密制度,其内部的运转机制对于外界来说是非常神秘的,除了来自官方的解密之外,合作方的爆料也成为了很重要的渠道,其中例如此前iPhone的相关爆料,就大多来自于各大供应商。这一次,外包公司员工成为了苹果保密体系的后门,与当年的“棱镜门”事件一样,这次爆料人看起来也是出于正义和责任感曝光了苹果的这种行为。

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

差分隐私,hey siri这个功能会不会有隐私泄露的隐患

《卫报》的这一报道几乎可以堪称是平地惊雷,自然也引发了用户的一片哗然。隐私与垄断可以说是目前苹果最大的两处命门,而不幸的是,在新款iPhone即将到来的时候,在这两个问题上却连续出现问题。如果说垄断是苹果商业模式的必然结果,那么此次Siri隐私问题的曝光,则是狠狠打了苹果的脸,毕竟在此之前,其一直以严格的隐私保护政策作为核心竞争力。

不同于黑历史比较多的其他同类企业,苹果之前给自己设立的人设可是“隐私保护先锋”。其高管在许多场合也都经常提及,“苹果公司的隐私承诺是严肃的,并不仅仅是为了赢得客户的信任”、“保护隐私是用户信任苹果的原因”。

更有甚者,在在当初Facebook深陷剑桥分析丑闻时,苹果CEO库克是这样讥讽扎克伯格的,“我们关心用户体验,绝对不会进入用户的私生活。对我们来说,隐私是人权,这是一种公民自由。苹果一直以来就是这么做的”。而在今年初的CES上,尽管没有参展,但苹果却在会场外竖起了一副巨大广告牌,用以概述其产品是如何保护用户的隐私。

娱乐圈明星塑造人设的目的是为了快速吸粉、一朝蹿红,而人设崩塌的后果则是粉丝脱粉、迅速凉凉,因此立人设绝对是一柄双刃剑。娱乐圈是如此,商业语境下也完全相同,用好故事包装自己,转头便炮轰竞争者失德行为的做法,在如今这个科技巨头愈发不被用户信任的局面下,则无疑是在走钢丝。

苹果真的保护了你的隐私吗?

事实上苹果也注意到了这一点,与此前火速回复《华尔街日报》的报道一样,这次苹果回复《卫报》同样神速。其在声明中承认,“Siri的一小部分询问请求会被分析,目的在于改进Siri的功能,但用户的Siri请求没有与Apple ID关联,Siri的回答在安全的环境下进行分析,并且所有的审查员都有义务遵守苹果严格的保密要求”,以及“用户被录音的比例仅占Siri日活用户的1%,并且每段录音仅持续几秒"。

粗看上去,这样的回应似乎表明这只是一个误会,这么低的比例、如此短暂的时间,苹果即使将这些隐私交给外包商也不会造成用户隐私的泄露,但事实真的如此吗?不管你信不信,反正我不信。在苹果官网上就已经注明,“你的姓名、通讯录、你听的音乐,和搜索的内容等特定信息,会通过加密协议被发送到苹果的服务器中”,并且“如果你开启了定位服务,所提出请求时的设备位置也将发送至苹果,用以帮助Siri提高回复的准确度”。

简而言之,苹果是既收集了你的姓名与电话,也会收集地址。当然官方的说法是,自iOS 10开始苹果使用了被称为“差分隐私(Differential Privacy)”的数据收集策略,利用Hash算法、分段抽样,和数学噪声注入等方式来实现,尽可能多的了解特定团体同时尽可能少的了解其中任何个体。简单来说,就是苹果不会将数据与个体一一对应,而是将其与其他上亿份信息混合在一起。

看起来好像万无一失,但是苹果的隐私策略再严格,并不代表外包商也会与其保持一样的尺度,而该报道中的据爆料显示,外包商的权限审核形同虚设,外部员工能够查阅的数据量异常广泛。但不同于其他形态的数据,语音想要进行分离是件很困难的事情,在样本足够的情况下,声纹识别这项技术可以发挥很大的作用,而通过音调、语速、停顿、强调等个人说话的特性进行分析,再结合位置信息定位,从茫茫人海中找到一个具体的人显然也绝对不是件太难的事情。

真实语音是Siri进化的关键

苹果、亚马逊与谷歌之所以要冒天下之大不韪收集敏感隐私的核心——其实并不是为了更好的卖广告。毕竟想要卖广告从用户的搜索行为、兴趣点击就能完成,其收集用户对话的目的或许是为了促进自家人工智能助手的更进一步进化,最起码此前亚马逊与谷歌都是这样对外界解释的。

没错,真实的对话才能促进智能语音助手的自然语义理解能力。而人工智能是依托于深度/机器学习的结晶,其基础是海量的数据,需要有足够多样化的数据作为支撑,才能让Siri对人类语音的理解能力更上一层楼。因此苹果方面收集的这些情景各异的人类对话片段,最大的特性就是环境噪声以及用户处于自然而非刻意的环境下,有着“贵在真实”的特性。

而以Siri为代表的智能语音助手之所以被推送隐私保护的风口浪尖,最重要的原因,是用户不知道语音助手会在什么样的情况下收集语音。这和此前有消息称美团与饿了么监听用户则完全不同,这二者作为第三方APP想要监听用户,则需要麦克风功能的授权,但是苹果、谷歌,以及亚马逊则是平台的开发者,在源码没有公布的情况下,这些智能语音助手什么时候被唤醒,用户是很难知道的。比如可能很多人都不知道,Apple Watch上的Siri会在用户抬起手腕时被自动激活,此时则无需说出那句经典的“嘿,Siri”。

针对这样的问题,用户可以说是处于很弱势的地位,由于技术水平的不对称,也很难知道智能语音助手会在何种情况下收集对话信息。并且其作为一个崭新的交互入口,被绝大多数科技企业认为是未来的发展方向,因此现阶段显然也不会有人会放弃这类产品或服务。

因此这就导致摆在用户面前的只有两条路,一是维持现状,以牺牲隐私的可能性换取交互的便利性,第二种则是拒绝此类产品,在相关设备的设置中,彻底关掉以Siri为代表的智能语音助手。那么对于你来说,更愿意选择哪一种方式呢?

2022-06-11

2022-06-11