爬取30亿人脸,被600家执法机构使用,这家公司揭了美国数据隐私老底

爬取30亿人脸,被600家执法机构使用,这家公司揭了美国数据隐私老底
2020年01月22日 08:30 机器之心Pro

机器之心报道

机器之心编辑部

你在脸书、推特等所有社交网络上使用的图片,都已被这家创业公司收集成数据集,而这家公司的客户里包括 600 多家美国执法机构。

在本周纽约时报刊登的一篇报道中,一家名为 Clearview AI 的创业公司,因其「数十亿张图像」组成的面部识别系统,一举成为社会热议的焦点。

如果任何一个陌生人在街上拍下你的照片,手机 app 很快就能搜到你的姓名、住址和其他详细信息,这个世界会变成什么样子?

Clearview 已经很大程度上让这个想法成为了可能,这家公司设计了一款人脸识别程序,比如说你给某个人拍张照片,把照片传到程序上面,就可以查看这个人的所有公开照片,包括这些照片的地址链接。

这个程序的的背后是一个超过三十亿张图像的数据库,Clearview 宣称这些图像是在 Facebook,、YouTube,、Venmo 等社交媒体上抓取的,这个量级远远超出了美国联邦政府或者任何一家硅谷巨头的的数据库体量:FBI 自己的数据库收集了全美公民的护照和驾照照片,其中「仅」包含 6.41 亿张照片。

仅靠一张脸,即可检索出全网所有相关图片。

听起来有点科幻?想来想去,《黑镜》里面确实有一集是讲这样的故事的。

看到任何陌生人都能很快得到他/她的信息,现实与科幻就差个打分系统了。

据报道,从去年开始,美国有 600 多家执法机构都借助这款程序来协助侦查犯罪案件,诸如入店行窃、信用卡诈骗、谋杀及性犯罪事件等等。不过大部分执法者对其背后的原理知之甚少,尤其是人脸图像采集过程中所涉及的隐私问题。

目前,Clearview 的数据集还没有向公众开放。公司的官网上显示,其产品仅向执法部门开放。但如果它一旦公开,那么对于普通人来说,通过一张脸去扒出一个人的资料,会变得如同在谷歌搜索一个人的名字那样简单。

更进一步来说,该程序还能用来做很多事情:比如识别抗议活动中激进分子的身份,不仅能搜出他们的名字,甚至还能知道他的住所、工作单位和社交关系网络;如果在地铁上遇到一个感兴趣的人,也可以这样做。

如上所述,Clearview 的系统是构建在包含30 多亿张爬取自网络(如 Facebook、YouTube 和 Venmo 等)的图像数据库上,爬取数据的过程可能违反了网站服务条款。执法机构可以根据具体情况上传相关人员的照片,然后 Clearview 系统会返回相匹配的图像以及图像链接、社交资料等。

这家公司创立于 2016 年,两位联合创始人中,一位是来自澳大利亚的越南裔人 Hoan Ton-That,他在十三年前辍学并移民美国,在尝试成为职业模特以后,突然投身科技圈,每天与人工智能、机器学习、图像识别的知识为伴。

Clearview AI 创始人 Hoan Ton-That。图源:纽约时报。

另一位是 Richard Schwartz,目前已经 60 多岁,此前是报社的社论编辑,后来担任过纽约市长 Rudy Giuliani 的助手。这两个人就是在 2016 年的一次读书交流活动上相识的,之后共同创办了公司。值得一提的是,这家公司在初创过程中还获得了来自 Peter Thiel 的投资,后者是著名的 PayPal 创始人,也是 Facebook 的天使轮投资人。

该公司的官网页面过分简洁:主要是一些业务的介绍,而对于创始团队、办公地点、发展历程等方面则没有细写。

https://clearview.ai/

肆无忌惮的网络数据爬取引发担忧

尽管此类系统可以为警方的办案过程提供便利,但不可避免的是,警方在使用人脸识别算法的过程中伴随着风险。假阳性识别会导致罪行误判,隐私拥护者担心人脸识别的过度使用导致人们时刻处于警方的监控之下。

包括此前一直饱受争议的人脸识别偏见问题,这是个由来已久的问题,在中日韩等亚洲国家开发的算法,识别东亚人的脸比白种人更准确;在欧洲国家开发的算法,在识别白种人的面部特征方面更加擅长。

而且使用这套系统的前提,是要把自己的照片上传到 Clearview AI 的服务器上,目前还不确定这是否安全——尽管 Clearview 表示其员工不会泄露你的照片。在该公司展示其技术的过程中,纽约时报记者 Kashmir Hill 竟发现公司可以在警方的系统中追踪她:

虽然 Clearview 公司正在避免隐私泄露的嫌疑,但人工智能系统确实是在进行不间断地监视。当一些警官应要求通过 Clearview app 搜索 Hill 的图片,很快 Clearview 公司的代表就打来电话,询问他们是否在和媒体进行采访——这很可能说明这家公司有能力得知执法部门正在搜索什么。

比起数十亿张照片被做成数据集更重要的是,Clearview 已经与超过 600 家美国执法部门达成了合作。尽管还没有对人脸识别系统的准确性进行实验性验证,但这家公司提供的技术已经可以做到遮住下半张脸,依然可以识别出你的身份,而且可以列出很多连你自己都不知道的照片。

Clearview 公司产品的曝光引发了各路媒体对于人工智能隐私的探讨,纽约时报援引一名专家的话说,这些人脸识别系统中的商业资本成分,必须在被滥用之前全面禁止。「一直以来,我们都在依靠行业自律来避免技术被应用到危险的方向上。但现在因为盈利的诱惑,一切都被打破了,」美国东北大学计算机科学教授 Woodrow Hartzog 说道。「如果人脸识别的技术不受控制,显然弊大于利,现在唯一能做的就是禁止它。」

大规模的数据,高性能的算法吸引了大量执法部门的注意,不过能让 Clearview 获得 600 多家部门青睐的主要原因肯定是价格。据报道,公司向执法部门推销的价格仅为 2000 美元。

Clearview 程序中的底层代码还显示该软件具备与 AR 技术配合使用的能力,这意味着佩戴 AR 眼镜的人可能会使用 Clearview AI 来立即确定任何人的细节信息。

在被媒体报道之后,Facebook 正准备调查 Clearview 搜集数据的行为。在一份声明中,Facebook 发言人表示:「我们的政策禁止其他机构爬取 Facebook 上的信息,或将信息加入索引。因此我们正在审查有关这家公司的声明,如发现违反规则的情况,我们将采取适当行动。」

参考内容:

https://www.theverge.com/2020/1/20/21073718/clearview-ai-facial-recognition-database-new-york-times-investigation-go-read-this

https://www.nytimes.com/2020/01/18/technology/clearview-privacy-facial-recognition.html

https://www.businessinsider.com/law-enforcement-using-unknown-facial-recognition-technology-facebook-photos-2020-1

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部