人们通常对于面部识别技术在 Instagram 滤镜和 Face ID 等应用中的使用感到习以为常。 然而,这项相对新兴的技术也可能让人感到一丝不安。 你的面孔就像独一无二的指纹,而其背后的技术原理却颇为复杂。
任何新技术都存在其不足之处,面部识别也不例外。 军队、警察、广告商 以及深度伪造内容制造者都在不断探索利用面部识别软件的新方法,其中不乏一些令人担忧的应用。
因此,当今社会比以往任何时候都更需要了解面部识别的工作原理。 认识到面部识别技术的局限性以及它未来的发展趋势,都显得至关重要。
面部识别的基本原理
在深入探讨面部识别技术的各种应用之前,我们有必要先了解其基本工作原理。 以下是三种面部识别软件的应用场景,以及它们如何识别面部的简要说明:
基础面部检测:在 Animoji 和 Instagram 滤镜等应用中,手机摄像头会“寻找”面部的显著特征,特别是眼睛、鼻子和嘴巴。 然后,利用算法锁定人脸,并判断其朝向、嘴巴是否张开等。需要指出的是,这并非真正的面部识别,而仅仅是面部检测软件。
Face ID 及类似系统:在手机上设置 Face ID 或类似系统时,它会拍摄你的面部照片,并测量面部特征之间的距离。 随后,每次解锁手机时,它都会通过摄像头“扫描”并测量,以确认你的身份。
陌生人识别:当组织出于安全、广告或执法目的需要识别面孔时,他们会使用算法将该面孔与庞大的人脸数据库进行比对。 这个过程与 Apple 的 Face ID 类似,只是规模更大。 理论上,任何数据库(身份证、社交媒体资料)都可用于比对,但包含清晰、预先识别照片的数据库是理想的选择。
接下来,我们将深入探讨细节。 由于用于 Instagram 滤镜的“基础面部检测”是一种非常简单且无害的过程,我们将把重点完全放在面部识别上,以及可用于识别面部的各种技术。
2D 图像是面部识别的基础
大多数面部识别软件主要依赖于 2D 图像,这并不令人意外。 这种做法并非因为 2D 面部成像具有极高的准确性,而是为了方便起见。 绝大多数相机拍摄的照片不具备深度信息,而且可以用于面部识别数据库的公共照片(例如社交媒体头像)也都是 2D 的。
为什么 2D 面部成像的准确性不够高? 因为人脸的平面图像缺乏深度等识别特征。 通过平面图像,计算机可以测量瞳孔间距、嘴巴宽度等变量。 但它无法判断鼻子长度或额头突出程度。
此外,2D 面部成像依赖于可见光谱。 这意味着,在黑暗环境中,2D 面部成像无法正常工作,并且在光线不足或光线怪异的情况下,其识别结果可能不太可靠。
显然,解决上述一些缺点的方法是使用 3D 面部成像。 那么,如何实现 3D 面部成像? 我们是否需要特殊的设备才能获取 3D 人脸图像?
红外摄像头赋予深度信息
虽然某些面部识别应用仅依赖于 2D 图像,但依赖 3D 成像的情况也十分常见。 事实上,你在使用面部识别功能时,可能已经涉及到一定程度的 3D 成像。
这种技术是通过一种被称为激光雷达的技术实现的,它类似于声纳。 简而言之,面部扫描设备(如你的 iPhone)会向你的面部发射无害的红外线网格。 然后,这个网格(一堵激光墙)会从你的脸上反射回来,并被手机上的红外摄像头(或 ToF 摄像头)捕获。
3D 成像的魔力在哪里? 你手机的红外摄像头会测量每一束红外光从你面部反射并返回手机所需的时间。 自然地,从鼻子反射的光线比从耳朵反射的光线行程更短,红外摄像头会利用这些信息来创建你面部的独特深度图。 当与基本的 2D 成像结合使用时,3D 成像可以显著提高面部识别软件的准确性。
激光雷达成像是一个有些抽象的概念,你可能难以理解。 如果有帮助,你可以想象你手机(或任何面部识别设备)中的红外网格是一个 针板玩具. 就像针板玩具一样,你的脸在红外网格中留下一个凹陷,你的鼻子显然比你的眼睛深。
热成像让夜间面部识别成为可能
2D 面部识别的缺点之一是它依赖于可见光谱。 用通俗的话来说,基本的面部识别在黑暗环境中无法工作。 但这个问题可以通过使用热成像相机来解决(类似于你在特工电影中看到的那样)。
“等一下,”你可能会说,“热成像不也依赖于红外光吗?” 的确如此。 但热像仪不会发射红外光。 它们只是检测物体发出的红外光。 温暖的物体会发出大量的红外光,而寒冷的物体则会发出很少的红外光。 昂贵的红外热像仪甚至可以检测到物体表面细微的温度差异,因此这项技术非常适合用于面部识别。
可见光谱图像、热图像和合成热图像。
有多种不同的方法可以使用热成像来识别人脸。 所有这些技术都非常复杂,但它们有一些基本相似之处,因此我们将尝试通过一个列表来保持简单:
需要多张照片:热像仪会拍摄对象面部的多张照片。 每张照片都聚焦于不同光谱的红外光(长波、短波和中波)。 通常,长波光谱会提供最多的面部细节。
血管图十分有用:这些红外图像也可用于提取人脸血管的分布图。 这听起来可能有些令人毛骨悚然,但血管图可以像独特的面部指纹一样使用。 它们还可用于查找面部器官之间的距离(如果典型的热成像产生质量较差的图像)或识别瘀伤和疤痕。
可以识别对象:使用多张红外图像来创建合成图像(或数据集)。 然后,可以将该合成图像与面部数据库进行比较以识别对象。
当然,热面部识别技术通常应用于军事领域,在日常生活中并不常见,你的下一部手机也不会配备这种功能。 此外,热成像在白天(或光线充足的环境)中的效果并不理想,因此除了军事应用外,它并没有太多的潜在应用。
面部识别的局限性
我们已经花了很多时间讨论面部识别的缺点。 正如我们在红外和热成像中所看到的,有可能克服其中的一些限制。 但是,仍然存在一些尚未解决的问题:
障碍物:正如你所料,太阳镜和其他配件可能会对识别软件造成干扰。
姿势:面部识别最适用于中性、正面朝向的图像。 即使是基于红外的识别软件,头部的倾斜或转动也会使面部识别变得困难。 此外,微笑、鼓起的脸颊或任何其他姿势都可能会改变计算机测量你面部的方式。
光线:所有形式的面部识别都依赖于光线,无论是可见光谱还是红外光。 因此,光线条件不佳会降低面部识别的准确性。 这种情况可能会有所改变,因为科学家们目前正在开发 基于声纳的面部识别技术.
数据库:没有合适的数据库,面部识别就无法工作。 同样的道理,不可能识别过去未被正确识别的面孔。
数据处理:根据数据库的大小和格式,计算机可能需要一些时间才能正确识别人脸。 在某些情况下(如执法),数据处理的限制会限制面部识别在日常应用中的使用(这或许是件好事)。
目前,绕过这些限制的最佳方法是将其他形式的身份验证与面部识别结合使用。 如果无法识别你的面部,手机会要求你输入密码或指纹。 此外,中国政府 使用身份证和跟踪技术来缩小其面部识别网络中的误差范围。
未来,科学家们肯定会找到解决这些问题的方法。 他们可能会在任何环境中使用声纳技术和激光雷达来创建 3D 人脸地图,并且可能在极短的时间内找到处理人脸数据(并识别陌生人)的方法。 无论如何,这项技术都具有巨大的滥用潜力,因此值得我们持续关注。