我们倾向于信任视频和音频记录的内容。 但有了人工智能,任何人的脸或声音都可以精确地重建。 该产品是一种深度伪造,一种可用于模因、错误信息或色情的模仿。
一看 尼古拉斯凯奇 deepfakes 或乔丹皮尔的 deepfake PSA 清楚地表明我们正在处理奇怪的新技术。 这些例子虽然相对无害,但却引发了对未来的质疑。 我们可以信任视频和音频吗? 我们可以让人们对他们在屏幕上的行为负责吗? 我们准备好迎接深度造假了吗?
Deepfake 是新的、易于制作且发展迅速的
Deepfake 技术只有几年的历史,但它已经爆炸成一种既迷人又令人不安的东西。 “deepfake”一词于 2017 年在 Reddit 线程中创造出来,用于描述通过人工智能对人类外表或声音的再现。 令人惊讶的是,几乎任何人都可以用一台蹩脚的电脑、一些软件和几个小时的工作来创建一个 deepfake。
信不信由你,左边的图像是deepfake。
与任何新技术一样,deepfakes 也存在一些混淆。 “醉酒的佩洛西”视频就是这种混乱的一个很好的例子。 Deepfake 是由 AI 构建的,它们是用来模仿人的。 被称为deepfake的“扣篮佩洛西”视频实际上只是南希佩洛西的一段视频 减速并修正音高 添加口齿不清的效果。
这也是 deepfakery 与《星球大战:侠盗一号》中的 CGI Carrie Fisher 不同的原因。 虽然迪斯尼花了很多钱研究嘉莉费雪的脸并手工重建它,但一个拥有一些 deepfake 软件的书呆子可以 免费做同样的工作 在一天之内。 人工智能使这项工作变得异常简单、便宜且令人信服。
如何制作 Deepfake
就像教室里的学生一样,人工智能必须“学习”如何执行其预期任务。 它通过蛮力试错的过程来做到这一点,通常称为机器学习或深度学习。 例如,旨在完成超级马里奥兄弟第一关的 AI 将一遍又一遍地玩游戏,直到找出最佳的获胜方式。 设计 AI 的人需要提供一些数据来开始工作,以及在出现问题时提供一些“规则”。 除此之外,人工智能会完成所有工作。
deepfake面部娱乐也是如此。 但是,当然,重建面孔与击败电子游戏不同。 如果我们要创建一个主持温迪威廉姆斯秀的尼古拉斯凯奇的 deepfake,这就是我们需要的:
目的地视频:截至目前,深度伪造最适合清晰、干净的目的地视频。 这就是为什么一些最有说服力的深度伪造是政客的。 他们往往在一致的照明下站在讲台上。 所以,我们只需要一段温迪坐着说话的视频。
两个数据集:为了让嘴巴和头部运动看起来准确,我们需要一个 Wendy Williams 面部数据集和一个 Nicholas Cage 面部数据集。 如果温蒂向右看,我们需要一张尼古拉斯凯奇向右看的照片。 如果温蒂张开嘴,我们需要一张凯奇张嘴的照片。
之后,我们让 AI 完成它的工作。 它试图一遍又一遍地创建 deepfake,并从沿途的错误中吸取教训。 很简单,对吧? 好吧,温迪威廉的凯奇脸的视频