小心隐私,你的手机和智能音箱都在录音给别人听。

发布日期:2019-08-01 浏览次数: 7392 次

前几天,差评君上网时,看到了这么一条有意思的新闻。

英国媒体 The Guardian ,也就是「 卫报 」发布了一篇文章,说「 苹果合约方定期听取 Siri 录音 」 。

差评君看完这个消息,感觉信息量有点大:

和 Siri 讲话会被录音?

这个录音还会被苹果拿到外面给别人听??

这两个事情,经过苹果证实,确实有小于 1% 的语音片段会被录下来上传,做人工分析。

也就是说这份报道是真的。

你平时和 Siri 说的话,真的有小概率会被录音,而且给苹果外包的第三方做分析。

而这么做的原因,和苹果之前写在隐私说明里的目的是一致的:提升 Siri 的用户体验。

尽管这种通过「 用户体验计划 」收集数据的方式已经被各大公司用了很久了,但苹果这一出还是让差评君觉得很不习惯 ——

这可是苹果啊,那个最重视隐私,在广告宣传中把隐私作为最大卖点的苹果啊。。。

在今年 1 月 CES 时期,从不参加 CES 的苹果照例缺席了 CES ,但竖起了大大的广告,写着「 在 iPhone 上发生的事情,只会呆在你的 iPhone 里 」。

虽然苹果证实的 1% 不算太高,但很明显,他们做的和这句宣传语是有出入的。

在语音助手收集录音这件事情上,向来注重隐私的苹果都做成这样了,这个行业还会好么?

事实上就是。。。不太乐观。

首先,差评君要先和差友们说清楚一点,现在的大公司做「 用户体验计划 」时收集的数据,除非法律要求,一般都是「 脱敏 」的 —— 也就是去标识化,能看到数据是啥,但分辨不出数据来源在哪。

如果哪家大公司这一点没有做好,那就不仅仅是大新闻了,而是丑闻了。。。

也就是说,无论是华为也好,苹果也好,三星、谷歌等等,一般情况下你都不用太担心有人用他们通过「 用户体验计划 」收集到的数据找到你。

那差评君为啥还说「 不太乐观 」?

因为文字信息这东西对电脑来说是字符,是可以用机器对敏感内容做一些预先处理的,苹果在这一点上尤其用心,还用到了差分隐私技术。

而语音内容的转换过程本身就是个极为复杂的机器学习过程,在这个过程中,往往需要人类参与给这些内容做标识,告诉机器哪段识别对了,哪段不对,把屎把尿地把语音人工智能教好。

说白了,要有人工参与这件事,这一点似乎做语音助手的科技公司都没少干。

苹果把一部分 Siri 录音传给第三方,让他们判断语音助手被唤醒的时候是不是意外,Siri 回答得好不好等等。。。

美国电商巨头亚马逊也雇人专门听自家语音助手 Alexa 采集的录音,从而提升体验

谷歌的 Google Assistant 语音助手虽然好用,但早些时候也证实聘请合同工听取用户录音。。。

由于给这些录音打标签等工作没啥技术含量,差评君上面提到的三巨头都选择了外包合约工来做这件事。

也就是说,在语音助手上,大家都在用一套类似的做法:

录音,让人类来检查录音,这些人还都是第三方合约工。

国内的很多科技公司,也或多或少存在类似的情况。

比如小米曾经公布了小爱同学的聊天统计,结果起到了负面宣传效果,一堆网民在微博下评论质疑隐私问题。

但目前为止,虽然让人类来听这些录音,或多或少让人觉得心里膈应,但总归还是「 脱敏 」的吧?

这里差评君就要提及普遍存在的另一个潜在问题了 —— 意外唤醒。

「 天猫精灵 」、「 小爱同学 」、「 Hey,Siri 」、「 OK,Google 」 。。。

现在语音助手都能被语音唤醒,但有时候机器会「 误听 」到唤醒词,在主人不知道的时候就开始聆听了。。。

你确实不会在主动唤醒语音助手以后,开始说「 我家住在 XXX 」、「 银行卡号是 XXX 」。

但如果你不知道它被唤醒了,然后刚好随机算法轮到这 1% 的采集时间了呢?

根据「 卫报 」文章里做爆料的苹果外包工说:「 有不少录音的内容涉及隐私对话,例如医患讨论病情,商业合同,涉及犯罪的交易,以及性相关的内容 」

很多时候,用户本人都不知道,语音助手就被唤醒了,然后稀里糊涂地就被录音传了,然后。。。听到录音的是另一个活生生的人类。

总之,这一套逻辑下来可以看到,这很不安全,对隐私也存在威胁。

而这,目前还是没有啥好的解决方法,我们作为用户能选择的,顶多就是抛弃便利,关闭个性化和优化服务,或者干脆就不用。

这个问题说到底还是绕不开「 隐私和便利 」这个话题。

况且,人工智能产品如果样本数据量不够,是很难做好的。

科技公司们的初心也许就是单纯地想做「 用户体验计划 」,靠数据提升服务水平,又因为语音识别的特殊性,不得不介入人工。

但,这不意味着他们可以用妥协的方案来将就着,也不意味着他们应该在直到有人爆料之前,都一声不吭。

隐私和便利如何抉择,我们都抓秃了头,但不代表这就没法解决了。

苹果广泛使用的差分隐私技术,解决了传统数据隐私问题;也许哪一天有一门技术,可以搞定语音数据的隐私问题。

但不论如何,差评君觉得,这些大公司在语音助手的「 用户体验计划 」上,起码应该尊重用户的知情权。

 

转自:差评

分享到:
×

微信扫一扫分享

XML 地图 | Sitemap 地图