在人脸识别的“统治”阴影之下……

在人脸识别的“统治”阴影之下……
2020年09月18日 12:43 人工智能读芯术
图源:unsplash

人脸识别及其任务并非人类探索的新领域。早在1964年,当布莱索(Bledsoe)、海伦·陈(Helen Chan)和查尔斯·比森(Charles Bisson)一起尝试用计算机识别人类面部时,人类对人脸识别的探索就已经开始了,随后经历了不断失败和发展的过程。

历史学家认为布莱索等人是自动化人脸识别的开拓者。布莱索对自己的事业感到很骄傲,不过由于此项目是由一个秘密情报机构资助的,因而并未得到太多宣传,公开发表的信息非常少见。

基于数据的有限性,布莱索最初使用的方法包括在人脸上进行人工标注,例如眼部中心、嘴部等标志性部位;接着,计算机会将这些标注进行精确的旋转,以对不同的姿态变化和面部表情做出相应补偿。

人脸及图像上参照点之间的距离也会被自动计算,用于和照片作比较,以此确定被识别者的身份。然而,考虑到图像与照片数据库的广泛性,我们所遇到的障碍是,如何从数据库中提取出一个小的记录集,以便其中一个图像记录可以用来与照片进行配对。

布莱索认为,最大的困难来自于人的头部位置、面部表情以及年龄的易变性。但一些研究人员经常使用却未经处理的光学数据相关方案(或匹配模式),在变化显著的情况下必定会失败,同一个人两张不同头部旋转位置的肖像之间的相关值非常低。

这些挑战一直持续到近几十年,直至大数据筒仓以及具有巨大处理能力的量子计算机被发明并投入使用,转折点才算出现。

而如今,这一技术难题的解决把其他的重要问题推到了我们面前,个人隐私、歧视与种族主义,这些都是近来引发巨大关注的话题。在许多国家,高精度人脸识别技术的滥用已引发不少法律问题。例如,英国南威尔士警方在前不久就因人脸识别系统的歧视性使用被告上法庭,该系统是由政府批准使用的。

种族定性与人脸识别

人脸识别软件可能存在种族偏见。科技当然没有与生俱来种族偏见,然而,依据其算法,经过不同训练的人脸识别系统,能够比识别亚洲和非洲人种更准确地识别出白人的脸。

更确切地说,就如前面提到过的,在创造精确人脸识别的数学公式的历史上,一些最幽微的失败就在于创造者对“战术一致还是战略一致”(tactical vs. strategic alignment)的抉择。

《大西洋月刊》(the Atlantic)最近的一项研究表明,人脸识别准确率的提高速度在各特定群体中并非平均分布。目前许多种算法都在不同种族、性别及其他人口统计数据的精确度上表现出了令人不安的差异。

NIST(美国国家标准与技术研究所)供应商测试的组织者之一在2011年进行的一项研究发现,韩国、日本、中国等一些亚洲国家开发的人脸识别算法在辨识亚洲面孔时的准确率远高于辨识白人面孔。同样,法国、德国和美国采用的算法则在识别白种人面部特征上显现出明显优势。

算法的构建条件,尤其是开发人员和测试照片数据库的种族构成,很可能对识别结果的准确性产生重大影响。这就是为什么要在战略上克服这样的障碍,开发人员是有可能基于种族、性别和民族,通过干预个人数据库轮廓的建立来开辟捷径的。

图源:unsplash

人脸识别过程的通俗解释

要明白人脸识别如何运作、如何与数据安全和歧视相关联,我们必须首先搞清楚它的历史发展和基本原理。从根本上来看,人脸识别的实现需要两个步骤:

· 对目标主体进行特征提取和选择。

· 对提取到的目标图像数据进行分类。

从历史上看,在执行以上任务时最瞩目的技术包括以下几种:

传统方法

一些算法通过提取人脸图像上的面部“地标”或“地形”来识别人类脸孔。面部“地形”包括相对位置、尺寸和/或眼睛形状、鼻子、颧骨及下巴等,这些提取到的“地形”会被用来搜索与其特征所匹配的图像。

其他一些算法会对一组面部图像进行归一化处理,由此创建一个面部轮廓数据集。把这个数据集与探测图像对比之后将其压缩,仅保留图像上对面部识别有用的数据。

识别算法的两种基本方法:几何法(Geometric)与测光法(Photometric)

几何法关注脸部的显著特征,测光法则采用一种统计学方法,将图像转化为数值,并将这些数值与模板关联起来以消除差异,从而进一步将其细分为全功能(all-inclusive)和基于特征的(feature-based)模型。全功能模型试图把脸部作为一个整体进行识别,基于特征的模型则将人脸分成几个要素来识别。后者会根据特征进行对比,并分析每个特征及其与其他特征之间的空间位置关系。

3D识别的概念

3D人脸识别程序利用3D感应抓取脸部轮廓数据,这些数据接着被用来辨认人脸皮肤的独特细节,比如眼窝轮廓、鼻子和下巴。比起其他技术,3D人脸识别的一个优势在于它能够不受光线变化的影响,也能从轮廓视角等一系列视角来识别脸部。

皮肤纹理分析

皮肤纹理分析把皮肤上独特的线条、纹路、斑点等转化为数学公式。它的工作原理和面部识别十分相似,在皮肤纹理分析的帮助下,人脸识别的表现能提高20%-25%。

结合不同技术的人脸识别

图源:unsplash

由于每种技术都有自己的目标用途和缺陷,科技公司结合了人脸识别的传统方法、3D识别技术和皮肤纹理分析技术,创建出具有更高成功率的人脸识别系统。

结合热成像技术的人脸识别科技

一种特殊的面部数据提取方法是使用热成像或红外摄像机,这一方法能够帮助相机排除眼镜、帽子、妆容等外饰的影响,检测到人真正的头部形状。它也使得相机能够在低光照下或夜晚获取脸部图像,从而避免打开闪光灯,暴露相机位置。但是由于热成像相机对细节的敏感度较低,这一方法总是与先前提到过的其他方法相结合。

那么,人脸识别从哪里开始变得具有歧视性?

如前所述,任何一种人脸识别技术的算法设计,都在一定程度上涉及到“定性”(profiling),这些“定性”无可避免地需要经过细致的道德考虑。

我个人认为这种“定性”模式可以通过嵌入合适的、不带偏见的深度学习算法来避免。然而,(至少从目前来看)一些实体可能会因财政限制和争取竞争优势而放弃这一途径。所以,意料之中,目前大多数人脸识别技术,不论它们采取了哪些技术方法,都被标记为具有歧视性和偏见性“定性”。

例如,前不久的一项报道发现,在加利福尼亚州洛杉矶的逮捕和监禁重点关注对象名单上,具有非洲血统的人员占比极高。进一步调查发现,这一现象产生的原因在于这些人脸识别科技背后的支撑算法在辨识黑人群体时功能下降。

此外,由于人脸识别技术在全国各地执法部门中的推广使用,随之而来的是越来越多的守法公民被“定性”和监禁,而立法机构却很少去探索和纠正这种偏见。

根据推广人脸识别科技企业的说法,它们的产品高效、准确,有着超过95%可靠性。但事实上,这一数字几乎无法得到证实。因为众所周知,警方采用的人脸识别算法在应用于普通公民身上之前,没有义务经受公开或独立的检查,以确定其准确性与核查是否存在偏见。更令人头疼的是,对应用最广泛的人脸识别系统的不充分测试,暴露了一些种族偏见的模式。

种族定性并非偶然事件,这在公共调查中尤其明显。后者进一步加固了这样一个事实,即为什么像警察及它们所选用的供应商不需要披露其专属的系统算法。

种族定性在本质上是一种歧视行为。在世界各地执法人员基于种族、民族、宗教、国籍将个人锁定为犯罪嫌疑人的过程中,种族定性常常会出现。

另一种种族定性的模式从9·11事件以后一直在持续发生,穆斯林、阿拉伯人和南亚人会因轻微的移民违法行为被拘留,即便它们与世贸中心的袭击毫无关联。在现实中,尽管美国已经声称自己进入了“超越种族”的时代,种族定性仍然是一个长期存在且令人深感不安的普遍性问题。

人脸识别技术的常见用途及其缺陷

图源:unsplash

从防止零售犯罪、追踪失踪人员到核查学习出勤,人脸识别技术用途广泛。技术市场正在呈指数级增长。据研究,美国的人脸识别市场预计将从2019年的32亿美元激增到2024年的70亿美元。

人脸识别技术最重要的用途是监控与营销,这引起了很多人的不安,主要原因在于人脸识别技术的使用缺少适当的联邦法规。例如,研究发现其中的一个问题是,这一技术在有色人种的面孔辨识上是不准确的,尤其是在识别黑人女性时。

随着人们对人脸识别软件及其应用的焦虑感和隐私担忧越来越多,美国各个城市在试图安抚人们的这些担忧时将会经历更大的困境。

和其他任何技术一样,当涉及到错误时,人脸识别技术的“假阴性”(false-negative)和“假阳性”(false-positive)结果也是需要考虑的现实问题。

“假阴性”是指系统无法将人脸与数据库中的图像进行匹配,或者所运用的方法在响应查询时返回零结果。“假阳性”则是指系统无法与数据库中的人脸匹配,但这一匹配结果是错误的。这种情况下,当警察向系统呈现某位嫌疑人的相貌特征时,系统会出现错误警示,将其误认为是另一个人的照片。

人脸识别系统的算法决定其用途

人脸识别科技的优劣在于其算法的质量。也就是说,它也是一种发挥自己被赋予的既定功能的技术。例如,目前冠状病毒肆虐,人们为了避免病毒传播,常会将脸遮挡起来,这是人脸识别技术的发明者们正在努力去适应的新世界。

近年来,人脸识别变得越来越流行,也越来越准确,这是因为深度学习让计算机在解析图像方面做得更好。但有些专家指出,目前人脸识别算法的可靠性总的来说会受到脸部遮挡的影响,无论这种遮挡是由障碍物、相机角度还是口罩带来的,因为遮挡就意味着提供给计算机分析的数据减少了。

人脸识别完全在于“定性”(Profiling)

从科学角度来看,人脸识别技术与比较、匹配有关,后者要求对常见相似性和匹配度的考虑。因此,不论目的是什么,“定性”总会成为必须考虑的问题。不过,这并不一定要以个人和公民的自由为代价。这就是为什么在铺天盖地的批评中,一些厂商,尤其是和政府机构合作更少的那些生产厂家至少暂时地放弃了它们的人脸识别项目。

出于对警方种族定性的担忧,IBM最近退出了人脸识别市场,并呼吁美国国会开展“全国对话”,探讨该技术在执法中的使用。同样,微软总裁布拉德·史密斯(Brad Smith)告诉《卫报》,如果政府将其用于大规模监控,微软会考虑对其人脸识别技术予以保留。

人脸识别算法存在偏见

目前的理论普遍认为,大多数人脸识别的解决方案都是带有偏见的。这条路很难避开,因为大多数人脸识别科技运用于执法和公共场合,且不需要通过适当的验证程序和公开。

国会中的民主党人目前正在调查FBI和其他联邦机构是否部署了监控软件来对付参与“黑人的命也是命”(Black Lives Matter)抗议的示威者;包括加利福尼亚和纽约在内的一些州也在进行法律评估,以禁止警方使用这项技术。

与此同时,市场中的一些大型科技公司正在逐步暂停自己的人脸识别项目。例如在民权倡导者的多年压力下,亚马逊最近宣布,警方将推迟一年使用自己一款并不可靠的人脸识别产品——Rekognition。IBM再次宣布自己有意完全退出人脸识别研究项目,理由是担心该技术对人权的影响。

迄今为止,“面部监控”是执法部门可获得的技术中最易暴露、最危险的技术之一——因为正如目前的情况一样,它在许多方面都具有歧视性。

首先,这项技术本身就可能是有偏见性的。其次,美国许多地方的警察都使用面部照片数据库,通过人脸识别算法对人进行分类。然而,使用面部照片数据库进行人脸识别,延续了过去的种族偏好,并在21世纪的监控技术下进一步加深了这种偏见。

“研究表明:算法也有种族主义”

2018年,伯拉姆维尼(Buolamwini)和吉布鲁(Gebru)进行的一项研究显示,在一些人脸识别算法中,黑人女性被错误分类的几率接近35%,但对白人男性的分类则几乎完全正确。随后麻省理工学院的伯拉姆维尼和拉吉(Raji)证实了这些问题在亚马逊的软件上也持续存在。

企业巨头不愿意公开自己的人脸识别算法

最近英国对NEC(人脸识别技术的提供者)的断然回绝,或许会有利于美国的活动家开展运动,并由此将运动浪潮向全球传播。在所有目标企业中,拥有全球范围内1000多份合同的NEC,即便不是主要目标,也会是其中之一。

在针对南威尔士警方的起诉案上,NEC的回应并未提供太多细节,它们拒绝透露在训练算法辨识不同人脸的过程中用到了什么数据。据称,2018年一项针对NEC人脸识别技术的测试得到了98%的错误率,2019年的一次审查发现其“假阳性”率为81%。

2019年,来自埃塞克斯大学人权中心“人权、大数据及科技项目组”的研究人员写报告称,他们发现伦敦警察署采用的实时人脸识别方式中存在着显著缺陷。并且,他们还发现,由于警方未能测试他们的系统在处理非白人面孔时的准确率,许多黑人和少数族裔被错误定性和讯问。

正如前文所提到的,人脸识别技术及其周边的一系列混乱,使得一些科技公司选择退出市场,至少目前是这样。

在我个人看来,由于各种执法程序都是由“定性”驱动的,他们或许可以明确表达出对强化技术的需求,即一种基于人类特征的二次输入数据的技术强化。人脸识别的偏见性与歧视性很有可能是追求便利和低成本的后果。举个例子,如果警方已经通过人工档案来筛选,那么这种操作也有可能被用于他们的操作性和技术性需求中。执法部门已经使用定性技术长达几个世纪了,在人脸识别中继续沿用也就不足为奇了。

一旦我们把NEC和南威尔士警方之间业务关系的谜题放在一起, NEC不愿透露隐藏算法的原因就会变得清楚得多了。如今,NEC在世界各地部署了1000多个公开的生物统计识别系统,其中包括美国的20个州。可以预见,该公司在各个协议中都包含着许多隐藏条款。或者像IBM这样的公司放弃人脸识别技术,只是为了避免将来产生更多的问题。

人脸识别技术带有种族主义,并会悄然根据技术要求行事

尽管有关人脸识别技术的负面宣传铺天盖地,但它对任何行业来说都是一笔宝贵的资产。然而,就像其他任何工具一样,人脸识别技术很可能会被误用,或者被战略性的改变核心以完成设计者的不同任务。并且当他们真的要这么做的时候,他们会尽其所能将此隐藏起来。

图源:unsplash

记住,根据既定的人类特征,如肤色、性别、种族和畸形,来对人定性是很容易的。尽管这种便利对执法部门有很大的吸引力,但换取这一便利的代价,是那些从未犯错的人,仅因某些特征就成为被羞辱和被忽视的对象。这根本不公平!

人脸识别是一种工具,它的运作由工程师的精确指令所驱动,而这些指令是工程师基于执法部门的要求所写的。因此,当算法中被检测出种族偏见,该技术发展过程中的所有环节参与者,从商业要求,到资格审核,再到投入使用,都应受到质问。

“人脸识别的种族主义程度与其开发者和使用者保持一致”。它是不道德的、带有偏见的,并且一定是不合法的,我们应当保持对它的质疑。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部