当今企业正积极探索深度伪造技术,以此创造逼真的虚拟场景,对业务产生深远的影响。深度伪造技术的出现使得辨别网络上的真实图像和视频变得极具挑战,因为这些多媒体内容可能被篡改甚至完全伪造。
与此同时,许多人也在以符合伦理道德的方式利用深度伪造软件。本文将深入探讨深度伪造的本质,其在商业领域的潜在优势,以及与之相关的诈骗行为,并对当前可用的优秀开源深度伪造软件进行盘点。
深度伪造是什么?
深度伪造是一种利用复杂的人工智能模型生成的高度逼真的视觉内容。这些内容,包括图片、音频或视频,乍一看与真实内容几乎无异。深度伪造的创作者运用深度学习技术(机器学习的一个分支)来生成此类影音作品。
借助深度伪造技术,可以创造出虚构的人物,并为其配上虚假的嗓音。另一方面,也可以将视频中人物的面部替换为其他人的面部,同时保留原有的声音。创作者甚至可以修改声音,使其听起来像是名人正在说出特定的语句。
以下是一个深度伪造视频的示例:
这段视频看起来非常真实,初次观看的人很可能会信以为真。然而,实际上这段视频是多年前制作的。
深度伪造技术对商业领域的益处
深度伪造技术的一个应用是制作网络迷因。然而,也有不法分子利用这项技术散布虚假信息,甚至损害品牌或个人的声誉。
尽管如此,深度伪造技术也为创意品牌和企业主带来了诸多好处。以下列举了一些深度伪造技术在商业领域的积极应用:
- 降低制作成本:企业不再需要支付演员费用,搭建昂贵的拍摄场景,或者聘请摄影师和摄像师。他们可以通过深度伪造技术制作高质量的视觉内容。
- 个性化内容制作:企业可以利用深度伪造技术制作个性化的内容和广告,这些内容可以针对特定的地区、细分市场或行业。
- 虚拟网红:聘请真人网红的成本可能非常高昂。深度伪造技术为企业提供了创建虚拟网红的机会,来推广和支持品牌。
- 改善客户服务:企业可以通过多种方式在客户服务中使用深度伪造技术。例如,公司可以设置一个虚拟发言人,24/7全天候解答常见问题或与客户互动。
- 提高可访问性:可以利用深度伪造技术来制作各种残障人士可以访问的内容。例如,可以使用深度伪造技术为听力障碍人士制作手语辅助的文章。
深度伪造诈骗及其识别
深度伪造诈骗是指利用深度伪造技术进行的欺诈活动,旨在达到欺骗、恶意或经济利益的目的。这类诈骗可以有多种形式,例如语音诈骗、视频冒充、虚假代言和虚假访谈。
例如,你可能看到过一些针对知名人士(如政治家或名人)的虚构视频。这是一个模仿乌克兰总统泽连斯基的视频的典型案例,该视频声称他的“军队已经投降”:
这是否意味着我们不能再相信在网上看到的任何东西?并非如此。幸运的是,我们现在可以通过以下方法来识别深度伪造品:
- 表情:仔细观察面部表情或肢体动作可以帮助你判断视频的真实性。留意讲话时嘴唇是否有不自然的动作以及是否存在停顿。
- 肤色不均:这是深度伪造视频中常见的特征。检查面部/头部的肤色是否与其他身体部位(如手)相匹配。
- 过渡:大多数深度伪造视频都集中于正面。如果你正在观看的视频有其他视角,请检查过渡处是否存在异常情况。
- 修补痕迹:你需要一个高分辨率的屏幕才能发现计算机生成的图像上的修补痕迹。如果是视频,你可以暂停、截图,然后分析皮肤是合成的还是天然的。
大多数人使用复杂的专用计算机来制作深度伪造品。幸运的是,你也可以使用现成的深度伪造软件来制作此类内容。
以下是一些制作深度伪造的最佳软件应用程序:
换脸软件
FaceSwap 是一款深度学习工具,用于识别和交换面部。该工具的开发者使用了 TensorFlow、Keras 和 Python 等机器学习领域的重要技术。
FaceSwap 设计为可在 Windows、macOS 和 Linux 上运行。它的存在是为了发现和探索人工智能技术。可用于电影、政治或社会评论,或任何其他符合道德的应用。
主要特征:
- 最适用于视频和图像中的面部交换
- 适用于 Linux、macOS 和 Windows 操作系统
- 免费使用
该平台有一个专属论坛,用户可以在其中互动并分享使用该工具的想法。
深脸直播
DeepFaceLive 是一款用于视频通话和电脑直播的实时换脸工具。你可以使用训练好的模型或通过网络摄像头实时替换视频中的面部。该工具内置了数百张不存在的人脸。
主要特征:
- 零依赖性
- 兼容 Windows 10 及以上版本
- 适用于视频通话和电脑直播的实时面部替换
该平台还提供 DeepFaceLab,你可以在其中训练自己的面部模型,从而获得更高的质量和更好的面部匹配效果。你也可以选择使用面部动画制作器,来创建 gif 和其他短视频格式。
深脸实验室
DeepFaceLab 是一个领先的面部交换框架。该软件配备了正确的工具,可以帮助用户创建高质量的面部交换效果。对于那些希望通过松散和灵活的耦合来增强管道,而无需编写复杂的样板代码的人来说,这也是一个理想的选择。
主要特征:
- 适用于 Linux 和 Windows
- 这是一个面部交换框架
- 可以使用 Google Collab 进行训练
DeepFaceLab 具有高度可定制性,用户可以修改其管道的各个方面以满足自己的需求。该工具允许你执行不同的操作,例如交换面部、面部去老化和嘴唇操控。
模拟交换
SimSwap 是一个用于视频和图像的面部交换框架。该工具的设计理念是在交换面部时保留诸如视线方向和面部表情等属性。这种方法可以轻松地使生成的面部与源面部高度相似。
主要特征:
- 面部交换框架
- 适用于视频和图像
- 可以适应任意身份
该工具旨在扩展特定身份的面部交换架构,并允许交换适应任意身份。该工具是使用 Python 及其库(如 NumPy、PyTorch 和 TorchVision)创建的。
人脸融合
FaceFusion 是一款面部交换器和增强器。该工具适用于 macOS、Linux 和 Windows 用户。FaceFusion 专为机器学习专家和具有技术技能的人员设计。你需要至少 4GB 的 RAM 才能顺利运行该软件,但 8GB 或以上是理想的选择。
主要特征:
- 面部交换器和增强器
- 零依赖性
- 免费使用
FaceFusion 的目标是人工智能生成的媒体行业,用户可以生成角色作为服装系列的模型,甚至可以制作自定义角色的动画。该工具是使用 Python 构建的。
鬼
Ghost 是生成式高保真单次传输的缩写形式。该工具使用单次镜头,这意味着它使用单个源图像来交换视频或图像中的目标面部,而无需额外的训练阶段。Ghost 的设计目的是在交换完成后保持目标面部的活力。
主要特征:
- 交换视频和图像中的面部
- 使用单次方法
- 开源
Ghost 使用眼睛损失功能来保留目标面部中的眼睛方向。该工具还使用自适应混合,允许用户有效地传输源面部的形状。该工具具有图像到图像和单次图像到视频管道,可实现高质量的交换。
悲伤语者
SadTalker 是一款 3D 运动系数生成器。该工具可以生成表情和头部姿势,以创建说话的面部渲染效果。生成的视频可以是不同的语言,例如英语或中文。这些模型还经过训练,可以控制眨眼动作,使其尽可能逼真。
主要特征:
- 多平台支持
- 适用于视频和图像
- 免费使用
SadTalker 是一款多平台工具,你可以在 Windows、Linux 和 macOS 上使用。该工具允许以不同的模式(例如调整大小、静止和参考)生成不同的图像/视频。任何拥有 4GB 或以上 RAM 的机器都可以运行 SadTalker。
实时语音克隆
实时语音克隆 是一款可以帮助你克隆声音并在几秒钟内生成任意语音的工具。该平台在基于 Windows 和 Linux 的系统上运行。当你将该工具安装到本地计算机上时,会自动下载该工具的预训练模型。但是,你也可以手动下载这些模型。
主要特征:
- 多平台支持
- 实时语音克隆
- 免费使用
实时语音克隆经过三个阶段来产生任意语音。用户在第一阶段根据音频创建语音的数字表示。最后两个阶段涉及从给定的任意文本生成语音。
结论
现在,你有各种各样的深度伪造软件应用程序可供选择,用于交换图像、视频或两者。虽然有些人出于恶意目的创建深度伪造品,但你也可以将它们用于商业和品牌建设。软件的选择取决于手头的任务和你的专业知识。请仔细分析每个工具,以确定它是否适合你的需求。
你还可以探索最好的人工智能语音克隆工具,来创建无缝、逼真的配音。