面部识别技术的商业应用
面部识别技术不仅仅局限于计算机科学领域,它在商业领域也拥有巨大的应用潜力。
近年来,“面部识别”已成为一个热门词汇。
作为应用机器学习的一部分,面部识别能够检测和识别人脸,这是一个长期以来计算机难以攻克的难题。这项技术为企业、政府和个人开启了一个充满机遇和挑战的新世界。
如果您是商业领袖,并一直好奇这项技术背后的原理及其应用价值,那么这篇文章将为您解答疑惑。我们将深入探讨面部识别的历史、发展、当前应用、争议、部署等多个方面。
读完本文后,您将全面了解面部识别技术及其对企业的影响。
让我们开始吧!
面部识别技术的发展历程
尽管面部识别技术最近备受关注和媒体报道,但实际上它已经存在一段时间了。最早在人脸检测算法方面取得重大进展的是2001年提出的Viola-Jones对象检测框架。尽管它是一个通用的图像对象识别框架,但很快被应用到人脸检测并取得了巨大成功。该算法的流行主要是因为它运行速度快。虽然训练过程可能非常耗时,但检测过程却非常迅速。
早在2001/2004年,普通台式电脑使用该算法可以在0.07秒内处理300px x 300px的图像帧(更多信息请查看这里)。尽管其准确率(约为90%)无法与人类相媲美,但仍然令人印象深刻。
然而,直到2010-2020年,当卷积神经网络成为执行面部检测的最佳方法时,才取得了真正的进展。这主要归功于基础设施即服务 (IaaS) 提供商通过云计算提供的强大计算能力和巨大的系统内存。历史上第一次,计算机在识别人脸方面超越了人类,尤其是在处理大量随机人脸时。
资料来源:medium.com
面部识别技术的工作原理
面部识别是一个多步骤的过程,涉及到多个专业的子系统。
以下是各个阶段的含义:
检测/跟踪: 预处理阶段的这部分负责识别和跟踪给定图像或视频文件中的人脸。一旦这个过程完成,我们就可以确定在给定的输入中存在一张脸,并可以对其进行进一步处理。如有必要,跟踪阶段还负责跟踪面部的特定部分、特征或表情。
对齐: 面部识别的一个难题是,给定图像或视频中的人脸可能不遵循任何标准。人脸可能被放大或缩小,可能从物体后方偷看,或者以侧面角度出现,这些都增加了人脸检测的难度。这就是面部对齐技术的用武之地:它能够确定给定图像或视频中面部线条的位置以及面部特征的轮廓。
来源:csc.kth.se
特征提取: 顾名思义,在此识别阶段,面部的各个特征,如眼睛、鼻子、下巴、嘴唇等,会被提取并以表格形式呈现,以便算法在下一阶段使用。在这个阶段,计算机已经收集了足够复杂的特征数据来区分不同的面孔。
特征匹配/分类: 在此阶段,从特征提取中获得的输入会与给定的数据库进行匹配,以推断出人的身份。此阶段也称为分类,因为算法可能需要对人脸进行分类,而不仅仅是单独识别它们。
一旦这个过程结束,我们就可以确定给定的人脸是否在我们进行比较的数据库中。最终输出可能还包括标记,就像我们过去在 Facebook 上看到的那样。
资料来源:向数据科学网
部署注意事项:服务器端与客户端
面部识别技术可以在服务器和用户交互的设备上运行。例如,当您将照片上传到 Facebook 时,算法是在服务器端运行的;而当您使用面部识别解锁手机时,算法则是在客户端运行的。那么,哪种方式更好呢?
实际上,并没有绝对的好坏之分。服务器端和客户端部署各有优势。在实践中,企业通常会部署混合系统。建议的做法是在服务器端训练模型,因为服务器端不受训练数据和处理资源的限制。一旦模型训练完成,就可以将其打包部署到客户端,从而提高系统速度并保护用户隐私。
将所有数据发送到服务器会引入延迟,这在某些情况下可能不太理想。而将所有处理都保留在客户端可能会导致模型较弱。
面部识别的准确率如何?
准确率在面部识别中并不是一个定义非常明确的术语。其主要原因是存在各种干扰因素,如光线不足、面部被头发遮挡、相机质量等,甚至是欺骗性的输入,这都使准确率成为一个模糊的概念。因此,涉及面部识别的神经网络需要针对具体应用场景进行调整,这限制了它们的适用范围。因此,虽然工业面部识别系统可能拥有100%的准确率,但在要求识别拥挤照片中的人脸时,同一系统可能连20%的准确率都达不到。
在一项研究中,一种特定类型的面部识别算法达到了98.52%的准确率,高于人类在相同测试中达到的97.53%。在另一项研究中,人类判断和算法的结合在某些情况下产生了最佳结果。
总而言之,对于目标明确、定义清晰的应用场景,面部识别是我们拥有的最佳工具。
面部识别的应用领域
即使在面部识别算法获得可行性后不久,它就找到了许多令人兴奋且有用的应用。其中一些应用非常引人注目,而另一些则非常微妙地融入了我们的日常生活,以至于我们几乎不会停下来思考它们。
Facebook 可能是现代面部识别系统最常见的应用案例。每当您上传照片时,这个社交网络就能够检测到人脸。以前您需要手动标记朋友,而现在 Facebook 可以自动完成。
资料来源:labnol.org
Facebook 最近推出的一项有趣的新功能是,当有人上传包含您面部的照片时,即使您没有在这些照片中被标记,系统也会通知您。
Snapchat 大量使用面部检测和识别来实现其众多功能,最值得一提的是那些风靡一时的趣味滤镜。
资料来源:gistreel.com
为了使这些滤镜正常工作,需要完美地检测到人脸的轮廓和特征,否则,叠加层会显得不真实。“换脸”是 Snapchat 上另一个流行的功能,也是如此。如果您有兴趣深入了解 Snapchat 在面部识别方面的功能,请参阅这里。
优步一直在与隐私和安全问题作斗争,而面部识别是该公司武器库中的新武器。该公司推出了一项新功能,通过人脸识别来验证司机合作伙伴的身份。该公司在其博客上表示,在测试了几家面部识别技术供应商之后,他们选择了微软的Face API,因为其质量很高。有趣的是,这种实时身份验证在弱光条件下运行良好,并且可以识别佩戴眼镜的人。
随着面部识别在实际应用中获得成功,我们很容易预测它可能很快会取代教育机构、医院、图书馆等其他识别方法。
零售犯罪预防是面部识别应用的自然延伸。零售业因入店行窃和其他零售犯罪造成的损失估计为每年450亿美元,而对此几乎没有什么有效的应对方法。现在,像FaceFirst这样的公司正在帮助零售商使用面部识别技术来检测以前的罪犯并提醒安保人员。
警方监控也开始像其他所有机构一样利用面部识别。例如,在英国,南威尔士警方正在使用安装在货车上的摄像头来监视人群。
资料来源:theconversation.com
尽管警方掌握的这项新权力引发了关于个人隐私的激烈公众辩论,但警方认为这将有助于他们更好地控制违法者。正如南威尔士警察局副局长理查德·刘易斯告诉《金融时报》的那样:
“如果发现某人以前犯过罪,你基本上是在说:我们知道你在这里,请自重。”
最近,医疗保健领域出现了一种意想不到的应用,面部识别技术有助于检测一种名为迪乔治综合征的罕见遗传疾病。
大约每6000名儿童中就有1人患有迪乔治综合征,并导致身体多个部位出现畸形。在这种情况下,医疗保健问题在资源匮乏的国家更为严重,因为这些国家缺乏获取昂贵诊断方法的资源。因此,面部识别技术凭借惊人的准确率(96.6%),为迪乔治综合征患者带来了新的希望。
在航空业,面部识别技术的应用正在加速发展,它很快将取代传统的登机牌。目前,它在识别旅客离开该国时已经取得了一些有限但有希望的成果。事实上,美国运输安全管理局(TSA)已经制定了一项计划,以广泛使用基于面部识别的生物识别技术。
面部识别的争议性应用
技术赋予我们力量,但它的好坏取决于我们如何使用它。因此,像面部识别这样强大而激进的技术,毫无疑问地正以一种引发人们对基本人权和道德关注的方式被使用。
面部识别最具争议的应用案例是中国庞大的监控系统,该系统使用大约2亿个摄像头来监视其14亿公民。
资料来源:sbs.com
该系统跟踪人们并评估他们的行为,不断更新一个名为“公民评分”的系统。尽管拥有一个强大的国家控制的监控系统(例如跟踪债务违约者)具有一定的价值,但大多数人认为这预示着乔治·奥威尔所描绘的反乌托邦未来的到来。这是一个政府对个人拥有无限权力并且不存在隐私的未来。
第二个有争议的面部识别应用案例也来自中国(不足为奇?)。这次,学校系统正在使用面部识别技术来确保学生在课堂上“专心”。这种新的面部识别系统虽然尚未普及,但它正在取代身份证、借书证、考勤系统等,转而使用学生的面部进行识别。
资料来源:businessinsider.com
更令人毛骨悚然的是,该系统还会监控学生的注意力水平、手机使用情况等,并在超过某个阈值时提醒老师。
尽管基于面部识别的视频监控并非中国独有,但美国一直在努力用它来遏制学校的枪支暴力——中国似乎比任何其他国家走得更远。
常用面部识别API对比
在使用面部识别时,您有哪些选择?在本节中,我们将探讨一些常用的方法,以及各种解决方案之间的差异。
不过,在我们开始之前,请注意这些API正处于快速发展阶段,您可能会看到一些博客文章说某个API缺少某个特定功能。不要以此作为决策的依据。首先分析您的业务需求,仔细检查所提供的功能,然后再做出决定。
OpenCV
人工智能研究是一个无底洞。训练和完善面部识别系统是一项艰巨的任务,最好留给财力雄厚、拥有大量研究人员的企业集团。但是,如果您的需求很简单,并且您希望拥有完全的控制权——当然,也准备好维护一个小型/迷你工程团队——OpenCV可能是一个不错的选择。
这是一个开源的计算机视觉库,非常准确,可用于所有编程平台。这是一个令人印象深刻的示例,展示了如何使用Python和OpenCV在25行代码中启动人脸检测系统!
现在,您可能会看到一些博客说OpenCV没有面部识别功能。这完全是谎言,这里是证明。总而言之,如果您的需求简单而具体,OpenCV可能是您业务的绝佳选择。
Amazon Rekognition
Rekognition是来自最大的云服务提供商之一AWS的重磅产品。它是AWS平台上一项完全托管的强大服务。如果您已经在使用AWS进行部署,那么Rekognition可能是最佳选择。
Rekognition提供的一些令人兴奋的功能包括:
- 实时分析(当您将图像或视频上传到S3时)
- 全面的面部分析(性别、发色、面部表情、是否睁眼等)
- 路径(捕获视频中识别出的对象的路径)
- 场景和活动检测(室内/室外、“踢足球”等)
- 审核不安全的内容(例如裸体)
Rekognition最大的优点也是最大的缺点——您很难将其与其他非AWS服务一起使用,以至于您可能不得不放弃。
Kairos
与Rekognition形成鲜明对比的是,Kairos通过API为您提供人工智能(押韵是无意的,我们发誓!),让您完全控制自己的数据和服务器。Kairos将自己定位为隐私至上的服务,并严厉批评亚马逊和其他与政府勾结的公司(美国公民自由联盟也是如此,顺便提一下)。
Kairos适用于图像和视频,并具有您期望从现代面部识别API获得的所有不错的功能。它具有Rekognition中的一些惊人功能,但如果您不需要这些功能,并且已经在管理自己的数据,那么又何必麻烦呢?!
对于那些对隐私感到偏执,甚至不想通过网络发送数据进行处理的人,Kairos提供本地部署,定价取决于您的使用情况,可能非常高昂。
Google Cloud Vision
谷歌选择区分图像和视频的面部识别服务。图像API被称为Cloud Vision,而以视频为中心的服务被称为Video Intelligence。
虽然以图像为中心的服务与AWS提供的服务非常相似,但视频服务具有出色的编目和搜索功能。这对于拥有可能想要分析或搜索的大型视频档案的公司来说很有用。
也就是说,在撰写本文时,Video Intelligence缺乏面部识别功能,而且这些功能似乎仅在Cloud Vision中提供。对象跟踪和文本检测也处于测试阶段,远远落后于亚马逊的产品。
Azure Face API
随着微软(最终)比桌面产品更认真地对待其云产品,Azure Face API是一个令人欣喜的产品。它具有您期望的所有有趣功能(检测、识别、面部分组、相似面部搜索、情感等),并且同样适用于视频。
现在,虽然这与面部识别并不严格相关,但值得一提的是,Azure还提供了客户计算机视觉服务,允许您根据需要使用输入和训练模型。
就像谷歌的服务一样,该网站上有一个可用的演示区,这使得测试API变得非常有趣!
顶级管理的面部识别服务之间是否存在显著差异?并没有。目前,该领域的竞争非常激烈,新功能的推出速度比比萨饼还快。如果您已经与特定的生态系统联系在一起,那么使用他们自己的面部识别服务是有意义的。否则,如果您的需求是特定的(控制您自己的数据、只需要简单的检测等),您可能想要选择不同的供应商。
反面部识别系统
正如一些研究人员毕生致力于完善面部识别技术一样,其他研究人员正忙于开发技术来欺骗这些系统。一个有趣的进展是对抗眼镜,从外表上看,它看起来与普通眼镜没什么不同,但却能够欺骗专业的人脸识别系统。
资料来源:digitaltrends.com
也就是说,这些眼镜尚未上市,尽管研究人员表示,它们很容易进行3D打印。
另一个有趣的进展是在Kickstarter上推出ekō眼镜。尽管该产品现在已被取消,但其概念非常简单:一副价值45美元的普通日常太阳镜,可以简单地反射光线,从而使相机和视频监控设备失效。
就像网络安全领域一样,“黑客”和研究人员正在争夺面部识别领域的制高点。在2014年左右,我们看到了迷彩妆,它可以让人们在面部识别面前变得“隐形”,但现在已不再可行。面部识别技术会引入AES加密吗?只有时间会给出答案!
面部识别适合您吗?
涉及人与人互动的企业都可以从面部识别中获益——是的,这意味着所有的企业!虽然目前面部识别的应用似乎主要由政府、大型企业或科技初创公司主导,但您的企业没有理由不能从中受益。
如果我们发挥一些创造性思维,可能性真的是无穷无尽的——在酒店迎接和识别客户,在人群中找到你的朋友,找到面容相似的人(可能被用作演员),在工作面试中检测个性(同样,我们只是在这里放飞想象力;在这方面的研究中可能没有任何实质性内容),当高价值客户走进银行时提供个性化的体验…… 有无数种方法可以使用面部识别来提高您企业的业绩,无论规模大小。
结论
很快,面部识别将变得非常普遍,以至于我们甚至都不会注意到它(就像手机一样)。底层技术已经接近完善,但在现实世界中,它不仅仅是检测人脸——而是我们如何利用这种能力。
听起来很有趣并且想了解更多信息? 看看这个关于计算机视觉的精彩课程。