人工智能正在以非凡的方式改变艺术世界。 人工智能在艺术领域的一个迷人应用是通过使用描述性艺术生成器。 这些生成器能够检查和解释图像,并根据分析生成全新的艺术作品。
在本文中,我们讨论了三种这样的 AI 艺术生成器:MidJourney、Stable Diffusion 和 Microsoft Bing Image Creator,并且在根据提示生成最佳结果方面,这三者中的哪一个名列前茅。
中途
MidJourney 由 David Holz 创立,是一种 AI 艺术生成器,它使用机器学习来识别现有艺术品中的模式和特征,然后可将其用于创作新作品。
MidJourney 于 2022 年 7 月 12 日进入公开测试版。在推出 MidJourney 之前,Holz 与他人共同创立了 Leap Motion,这是一家通过利用视频捕捉和手势来改变用户界面的初创公司。 2019 年,他将 Leap Motion 卖给了 Ultrahaptics。
随着 MidJourney 越来越受欢迎,Holz 分享了他对技术及其对艺术和社会的影响的见解。 Holz 将艺术家视为 MidJourney 的客户,而不是竞争对手,并相信该平台可以在构思阶段促进更大的创造力和实验。
但是,有人担心 MidJourney 的训练集可能会侵犯版权,其中可能包括其他艺术家的版权作品。
Holz 强调,MidJourney 旨在增强人类的能力,而不是取代它们。 他把它比作汽车,解释说仅仅因为汽车比人类快,并不意味着我们应该切断我们的腿。
通过使用 MidJourney 的 AI 图像生成,艺术家可以在创作自己的作品之前探索新的可能性并产生大量想法。
稳定扩散
Stable Diffusion 是一种开源机器学习模型,可以从文本生成图像,根据文本修改图像,或者在低分辨率或低细节图像上填充细节。 它已经过数十亿张图像的训练,可以产生与您从 DALL-E 2 和 MidJourney 获得的结果相当的结果。
Stability AI 的创始人兼首席执行官 Emad Mostaque 是负责 Stable Diffusion 的公司。 Stable Diffusion 是由 LMU Munich 的 CompVis 小组开发的潜在扩散模型,由 Patrick Esser 和 Robin Rombach 设计,他们之前创建了 Stable Diffusion 使用的潜在扩散模型架构。
Stability AI、CompVis LMU、Runway、EleutherAI 和 LAION 之间的合作使 Stable Diffusion 可供公众使用。
稳定扩散可以部署在各种平台上,包括 Windows 和 Apple 设备。 在应用程序中利用设备上的部署可以保护用户隐私,这比基于服务器的方法更可取。
微软 Bing Image Creator
微软推出了一款名为 Bing Image Creator 的新工具,它使用户能够直接在 Microsoft Edge 中创建自己的图像。 该公司发布了一套旨在激发创造力和自我表达的创作者工具。 该工具允许用户制作个性化图像以分享他们的生活更新或用于他们可能需要的任何其他目的。
用户可以从 Microsoft Edge 的侧边栏轻松访问 Image Creator。 Microsoft 已采取积极措施确保以负责任的方式使用该工具,并且不会助长攻击性内容的传播。
公司制定了内容政策,在某些情况下禁止使用Image Creator,用户可以举报任何违反该政策的行为。 此外,微软已经实施了技术来解决生成图像技术中可能出现的潜在偏差。
在本文中,我们将踏上旅程,评估每个描述性 AI 图像生成器在出现相同文本提示时的结果。
提示 1:在高速公路上一个温暖晴朗的晴天,现代圣诞老人骑着驯鹿拉着的雪橇
提示2:大眼睛动物的特写镜头,捕捉它的纯真和可爱
提示 3:一名人类宇航员在登陆新星球时受到敌对外星生物拔出武器的欢迎
提示 4:纽约市小说封面的现代抽象艺术,颜色大胆明亮
提示 5:一个人在两个盘子之间做出决定——一个是比萨饼,另一个是芝士汉堡
提示6:负伤武士骑马雪山,手执宝剑
提示 7:使用不同阴影显示水的运动和流动的抽象图像
提示 8:河流中的三文鱼,背景是郁郁葱葱的绿树
提示9:桌上放一杯水,用手挤柠檬
提示 10:从骑大象的人的角度看沙漠中的地平线
提示11:一片森林,纸币长在树上,鸟是由硬币组成的
提示 12:一碗拉面,cel 着色,夜间照明,照片级真实感
提示 13:Elon Musk 贫穷且失业
判决书
在评估 MidJourney、Stable Diffusion 和 Bing Image Creator 的输出后,很明显没有明确的赢家。
每个生成器都以独特的方式解释提示,在 Bing Image Creator 和 MidJourney 的输出中发现了相似之处。 当提示有清晰的描述但往往过于字面意思时,稳定扩散是有效的。 虽然 MidJourney 和 Bing Image Creator 通常是成功的,但它们偶尔会产生与提示不符的结果。
值得注意的是,Bing Image Creator 在生成任何辱骂性或煽动性的输出时会谨慎行事,当提示创建贫穷和失业的 Elon Musk 的图像时会发出警告消息。 微软采取这样的保护措施值得称道。
与此同时,MidJourney 的神经网络专业知识塑造了一个贫穷而孤独的埃隆马斯克的形象。 因此,可以得出结论,每个生成器都将迎合其各自的用户群。