现代企业正在利用深度造假来创造现实的幻象,从而对其业务产生积极影响。 有了 Deepfakes,现在你很难相信你在网上看到的任何图像或视频,原因只有一个:此类多媒体可能被更改或伪造。
另一方面,有相当多的人正在道德地使用 Deepfake 软件。 本文将讨论 Deepfake 是什么、它给商业世界带来的好处、Deepfake 诈骗,并回顾一些当今可以使用的最佳开源 Deepfake 软件。
目录
什么是 Deepfakes?
Deepfakes 是由复杂的人工智能模型生成的经过操纵的视觉内容。 生成的图片、声音或视频看起来就像真实的一样。 Deepfakes 创作者使用深度学习(机器学习子主题)来生成此类视频和图像。
通过 Deepfake,您可以创建不存在的角色并为其添加虚假声音。 另一方面,您可以将视频中表演者的脸部替换为另一个人的脸部,同时保留原始声音。 创作者还可以操纵声音,让其看起来像是一个名人正在说出你听到的话语。
这是深度伪造视频的示例:
视频看起来很真实,第一次观看你可能会相信。 然而,这个视频是五年前制作的。
Deepfakes 给商业世界带来了哪些好处?
创建模因是 Deepfakes 的用例之一。 另一方面,一些不良行为者利用这项技术传播虚假信息,甚至给品牌/人留下不好的印象。
Deepfakes 还为创意品牌和企业主带来了各种好处。 以下是深度造假在商业世界中的一些好处:
- 降低制作成本:企业不再需要支付演员费用、创建昂贵的拍摄场景或雇用照片/摄像师,因为他们可以使用 Deepfake 制作高质量的视觉内容。
- 个性化内容的制作:企业现在使用深度伪造来制作个性化内容和广告。 此类内容可以针对特定地区、利基市场或行业。
- 虚拟影响者:聘请实体影响者的成本可能很高。 Deepfakes 为企业提供了建立虚拟影响者的机会,以支持和推广品牌。
- 改善客户服务:企业可以通过多种方式在客户服务中使用深度伪造技术。 例如,公司可以有一名虚拟发言人 24/7 全天候回答常见问题或与客户互动。
- 改进的可访问性:您可以使用 Deepfakes 来制作各种残障人士可以访问的内容。 例如,您可以使用 Deepfakes 为听不见的人制作手语辅助文章。
什么是 Deepfake 诈骗?如何检测它们?
Deepfake 诈骗是使用 Deepflake 技术进行的欺诈活动,旨在欺骗或恶意目的或经济利益。 此类深度造假诈骗可以有多种形式,例如语音欺诈、视频冒充、虚假推荐和采访。
例如,您可能看过一段针对政治家或名人等知名人士的虚构视频。 这是一个模仿乌克兰总统弗拉基米尔·泽连斯基的视频的完美例子,声称他的“军队已经投降”:
这是否意味着我们不能再相信我们在网上看到的任何东西? 不会。幸运的是,您现在可以通过以下方式发现深度赝品:
- 表情:简单地看一下面部表情或身体动作就可以帮助您判断视频是否真实。 检查说话时嘴唇是否有不自然的动作以及是否有停顿。
- 肤色不均匀:此特征在视频中很常见。 检查面部/头部的肤色是否与其他身体部位(例如手)相匹配。
- 过渡:大多数深度伪造视频都集中在正面。 如果您正在观看的视频有其他视图,请检查过渡以确定是否存在异常情况。
- 补丁:您需要一个具有良好分辨率的屏幕来记录计算机生成的图像上的补丁。 如果是视频,你可以暂停,截图,分析皮肤是合成的还是天然的。
大多数人使用复杂/专用的计算机来制作深度伪造品。 幸运的是,您还可以使用现成的 Deepfake 软件来制作此类内容。
以下是一些制作深度赝品的最佳软件应用程序:
换脸
换脸 是一种深度学习工具,可用于识别和交换面孔。 该工具的开发人员使用了 TensorFlow、Keras 和 Python(机器学习领域一些最重要的技术)。
FaceSwap 设计为在 Windows、macOS 和 Linux 上运行。 该产品的存在是为了发现和试验人工智能技术。 它可以用于电影、政治或社会评论或任何其他道德应用。
特征
- 最适合在视频和图像中交换面孔
- 适用于 Linux、macOS 和 Windows 操作系统
- 自由的
该平台有一个专属论坛,用户可以在其中互动并分享如何使用该工具的想法。
深脸直播
深脸直播 是一款用于视频通话和电脑流媒体的实时换脸工具。 您可以通过使用训练有素的模型或网络摄像头面对视频来交换脸部。 该工具有数百张不存在的人的面孔。
特征
- 零依赖
- 兼容Windows 10及以上版本
- 适用于视频通话和 PC 流媒体的实时交换
该平台还提供 深脸实验室,您可以在其中训练自己的面部模型并获得更高质量或更好的面部匹配。 您还可以选择面部动画制作器,它允许您创建 gif 和其他短视频格式。
深脸实验室
深脸实验室 是一个领先的换脸框架。 该软件附带了正确的工具,可以帮助用户制作高质量的面部交换。 对于那些寻求松散且灵活的耦合来增强管道而无需编写复杂的样板代码的人来说,它也是正确的工具。
主要特征
- 适用于 Linux 和 Windows
- 这是一个换脸框架
- 可以接受 Google Collab 培训
DeepFaceLab 具有高度可定制性,用户可以修改其管道的各个方面以满足自己的需求。 该工具允许您执行不同的操作,例如交换脸部、脸部去老化和操纵嘴唇。
模拟交换
模拟交换 是一个视频和图像的换脸框架。 该工具的设计方式是在交换面孔时保留凝视方向和面部表情等属性。 这种方法可以轻松地使生成的脸部与源脸部非常相似。
主要特征
- 换脸框架
- 适用于视频和图像
- 适应任意身份
该工具旨在从特定身份的面部交换架构扩展,并允许交换适应任意身份。 该工具是使用 Python 及其库(例如 NumPy、PyTorch 和 TorchVision)创建的。
人脸融合
人脸融合 是一个换脸器和增强器。 该工具适用于 macOS、Linux 和 Windows 用户。 FaceFusion 专为机器学习专家和具有技术技能的人员而设计。 您至少需要 4GB 的 RAM 才能顺利运行该软件,但 8GB 或更多是理想的选择。
主要特征
- 换脸器和增强器
- 零依赖
- 自由的
FaceFusion 瞄准的是人工智能生成的媒体行业,用户可以生成角色作为服装系列的模型,甚至可以制作自定义角色的动画。 该工具是使用 Python 构建的。
鬼
鬼 是生成式高保真一次传输的缩写形式。 该工具使用单镜头,这意味着它使用单个源图像来交换视频或图像中的目标脸部,而无需额外的训练阶段。 Ghost 的设计目的是在交换完成后保持目标面部的活力。
主要特征
- 交换视频和图像上的面孔
- 使用单次方法
- 开源
Ghost 使用眼睛损失功能来保留目标脸部中的眼睛方向。 该工具还使用自适应混合,允许用户有效地传输源面的形状。 该工具具有图像到图像和单次图像到视频管道,可实现高质量交换。
悲伤语者
悲伤语者 是一个 3D 运动系数生成器。 该工具生成表情和头部姿势以生成说话的脸部渲染。 生成的视频可以是不同的语言,例如英语或中文。 这些模型还经过训练可以控制眨眼并使其尽可能真实。
主要特征
- 多平台
- 适用于视频和图像
- 自由的
SadTalker 是一款多平台工具,您可以在 Windows、Linux 和 macOS 上使用。 该工具允许以不同的模式(例如调整大小、静止和参考)生成不同的图像/视频。 任何具有 4GB RAM 及以上内存的机器都可以运行 SadTalker。
实时语音克隆
实时语音克隆 是一个可以帮助您克隆声音并在几秒钟内生成任意语音的工具。 该平台在基于 Windows 和 Linux 的系统上运行。 当您将该工具安装到本地计算机上时,会自动下载该工具的预训练模型。 但是,您也可以手动下载它们。
特征
- 多平台
- 实时语音克隆
- 自由的
实时语音克隆经过三个阶段来产生任意语音。 用户在第一阶段根据音频创建语音的数字表示。 最后两个阶段涉及从给定的任意文本生成语音。
结论
您现在拥有各种深度伪造软件应用程序,可用于交换图像或视频或两者。 尽管有人出于恶意目的创建深度伪造品,但您也可以将它们用于商业和品牌。 软件的选择取决于手头的任务和您的专业知识。 分析每个工具以确定它是否适合您的需求。
您还可以探索最好的人工智能语音克隆工具来创建无缝、真实的配音。