我们往往相信视频和音频记录的内容。然而,随着人工智能技术的进步,任何人的面容或声音都能够被精确地重塑。这种技术产生的产品被称为“深度伪造”,它可以被用于制作迷因、传播虚假信息,甚至用于色情内容。
只需观看一下 尼古拉斯·凯奇的深度伪造视频,或者乔丹·皮尔的深度伪造公益广告,就能清楚地认识到我们正在面对一种全新的、令人惊讶的技术。虽然这些例子相对来说是无害的,但它们引发了对未来的许多疑问。我们还能相信视频和音频的内容吗?我们是否能够让人们对其在屏幕上的行为负责?我们是否已经为深度伪造技术做好准备?
深度伪造:新兴、易制作且发展迅速
深度伪造技术仅出现几年,但它已经迅速发展成一种既引人入胜又令人不安的存在。“deepfake”(深度伪造)一词于2017年在Reddit论坛上被创造出来,用来描述通过人工智能对人类外貌或声音的再现。令人惊讶的是,几乎任何人都可以利用一台普通的电脑、一些软件以及几个小时的时间来创建一个深度伪造。
请相信,左边的图像实际上是一个深度伪造。
与任何新技术一样,深度伪造也存在着一些误解。“醉酒的佩洛西”视频就是一个很好的例子。深度伪造是由人工智能构建的,目的是模仿人物。然而,被称为深度伪造的“醉酒佩洛西”视频实际上只是一段南希·佩洛西的视频被减速并修改了音调,从而添加了口齿不清的效果。
这也是深度伪造技术与《星球大战:侠盗一号》中通过计算机图形技术(CGI)重建的凯丽·费雪的面容不同的原因。尽管迪士尼花费了大量资金研究凯丽·费雪的面部,并手工重建了她的形象,但一个掌握了深度伪造软件的爱好者可以在一天之内免费完成同样的工作。人工智能使得这项工作变得异常简单、廉价并且具有高度的真实感。
如何制作深度伪造
就像教室里的学生一样,人工智能需要“学习”如何执行其预定的任务。它通过一种反复试错的方法来实现,通常被称为机器学习或深度学习。例如,一个被设计来完成超级马里奥兄弟第一关的人工智能,会一遍又一遍地玩游戏,直到找到最佳的通关方式。设计人工智能的人需要提供一些初始数据和一些“规则”,之后人工智能会完成剩下的工作。
深度伪造面部再现也是如此。当然,重建面容与通关电子游戏是不同的。如果我们想要创建一个让尼古拉斯·凯奇主持温迪·威廉姆斯脱口秀节目的深度伪造,我们需要以下内容:
目标视频:目前,深度伪造技术最适用于清晰、干净的目标视频。这就是为什么一些最令人信服的深度伪造视频都是关于政治人物的。他们通常站在灯光一致的讲台上。因此,我们只需要一段温迪坐着说话的视频。
两个数据集:为了让嘴部和头部的运动看起来准确,我们需要一个温迪·威廉姆斯的面部数据集和一个尼古拉斯·凯奇的面部数据集。如果温迪向右看,我们需要一张尼古拉斯·凯奇向右看的照片。如果温迪张开嘴,我们需要一张凯奇张开嘴的照片。
之后,我们就可以让人工智能完成它的工作。它会不断地尝试创建深度伪造,并从中吸取教训。很简单,不是吗?嗯,实际上温迪·威廉姆斯的面容被替换成了凯奇的面容。