生成式 AI 搜索如何改变搜索引擎

正如我们从Yahoo.com、Google.com以及Bing.com等网站所见,生成式人工智能搜索代表了在线搜索的未来趋势。

自从Cortana、Siri、Google Assistant和Alexa等智能个人助理在移动设备上普及以来,人工智能(AI)已经深入我们的日常生活。在物联网(IoT)设备的应用中,人工智能正帮助我们控制家庭和工作场所的诸多事务。

现在,人工智能已扩展到多媒体制作领域,能够根据关键词或指令生成图像、视频、音频及文本内容。目前,先进的人工智能技术可以完美地编辑视频和音频等素材。总而言之,人工智能正在各个领域渗透。因此,人工智能影响万维网内容搜索的那一天已经离我们不远了。

什么是生成式人工智能搜索?

要理解生成式人工智能搜索的概念,首先必须了解生成式人工智能的本质。这种人工智能的主要作用是从样本内容中创造新的文本、图像、音频、程序代码等内容。

开发者利用机器学习(ML)模型来训练生成式人工智能,使其能够理解机器语言中的自然内容。这种人工智能可以是监督式、非监督式或半监督式的。

生成式人工智能模型

生成式人工智能采用多种机器学习模型来训练人工智能程序、聊天机器人或虚拟助手。以下是一些模型及其工作原理:

生成模型与判别模型

在人工智能训练的判别模型中,人类导师会训练人工智能学习输入样本中两个或多个对象之间的差异。例如,如果您向人工智能提供10种不同动物的10张图像作为输入,判别模型将帮助它成功区分这些动物。

另一方面,生成模型帮助人工智能在半监督或无监督的情况下,通过参考样本数据来创建对象。生成式机器学习模型使人工智能理解输入数据,并将这种理解存储在其神经网络内存中,以便在未来遇到类似挑战时调用。

生成对抗网络(GAN)

这种机器学习算法结合了人工智能训练的生成模型和判别模型。在此,生成模型根据关键词、问题等输入向量创建样本。

随后,判别模型必须识别所创建的样本是伪造的还是源自原始输入。如果判定为伪造,生成模型将重新处理任务,为判别模型创建新的输出。这个过程会不断迭代,直到生成模型创建出判别模型无法再与原始输入区分开的“伪造品”。

基于Transformer的模型

机器学习中的Transformer模型是一种深度神经网络,能够逐个序列地分析输入向量,并预测可能的输出结果。例如,如果您给Transformer一系列无关的词语,它会分析这些词语,并尝试预测可以填充到词语前面或后面的词,从而将不相关的词语转换为有意义的句子。

在Transformer中,编码器从输入序列中提取所有的特征或数据点,并将它们转换成输入向量。然后,解码器分析输入向量,根据数据建立上下文,并生成输出序列。

目前,有许多成功的基于Transformer的人工智能模型,例如:

  • 生成式预训练Transformer模型3,也被称为ChatGPT
  • 用于对话应用的语言模型,又名LaMDA,基于谷歌Transformer构建

借助以上模型,人工智能开发者已经成功创建了许多功能强大的生成式人工智能程序,它们能够从图像、文本、描述、音频等简单输入中执行或生成以下内容:

  • 通过引用来自网站、杂志、谷歌图像搜索等的输入,生成不存在的人类图像。
  • 从草图生成真实图像。
  • 将艺术或创意风格从一种艺术形式转移到另一种形式。
  • 将MRI图像合成为CT扫描图像。
  • OpenAI的Dall-e AI可以仅从文本创建出色的图像。
  • DeepMind、Amazon Polly等AI可以从文本生成人类语音。
  • 被苹果公司收购的AI Music可以将无版权的公共音乐转化为配乐。

现在,生成式人工智能搜索结合了所有这些人工智能工具和技术,旨在为您提供来自网络的准确内容。借助这种人工智能驱动的搜索功能,您无需再浏览谷歌、必应、雅虎等搜索引擎提供的数百万条建议。

生成式人工智能搜索将使您可以在一个屏幕上获取并利用来自在线资源的各种内容,包括图像、视频和文本,就像ChatGPT一样。

生成式人工智能搜索与传统在线搜索有何不同?

正如我们从1990年9月10日推出的Archie搜索引擎所知,如果生成式人工智能搜索普及且易于使用,网站搜索方式将会发生根本性变革。

传统的万维网搜索是一个需要手动操作的在线研究过程。您需要在搜索引擎的搜索框中输入您的问题或关键词。谷歌、雅虎、必应等搜索引擎服务提供商会根据其专有算法,权衡包含您所需内容的网站结果。

例如,网站在相关领域的权威性、用户群体以及网站页面质量等因素都会被考虑。随后,搜索引擎会根据这些因素为每个网站分配排名,并按排名显示结果。例如,排名第一的网站将出现在搜索引擎结果页面的最上方。

简而言之,传统在线搜索引擎并不创建内容,它们只是整合来自多个网站的内容。当您点击搜索结果时,您会被直接引导到特定的网站。

但是,随着生成式搜索的出现,您将获得高度整合的内容。底层的人工智能技术会分析所有的搜索结果,生成定制的内容,并通过网络浏览器呈现给您。其中可能包含指向生成式人工智能用来创建内容的来源的链接。

如果生成式人工智能搜索成为在线搜索的新标准,您还可以期待以下额外差异:

  • 搜索查询的输出内容在很大程度上取决于创建生成式人工智能搜索模型的公司之间的差异。
  • 某些用户群体可能更倾向于使用XYZ生成式人工智能搜索工具,而不是ABC工具。因此,基于在线搜索的使用情况会出现明显的偏差。
  • 此类搜索工具有时会生成类似的内容,发布者可能会面临在其网站上发布抄袭内容的风险。
  • 搜索结果将更加直观,并包含文本、图像、视频、音频等多种形式的相关内容。
  • 如果您在一个类似于ChatGPT的无干扰界面中获取内容,您将不再访问网站,也不会与网络广告进行交互。
  • 您的在线研究工作将大大减少。您不再需要浏览多个网页并自行编写内容。
  • 人工智能开发者将推出基于人工智能的新型在线广告和其他收入模式,以提高其运营利润。
  • 网络搜索的干扰会减少,但搜索质量可能会受到影响。
  • 您需要聘请有才华和专业的在线研究专业人员以及数据分析师来分析人工智能生成的内容,然后才能将其用于商业目的。
  • 关于如何将这种基于人工智能的网站搜索与源网站进行链接,并给予这些网站一定的信任度,目前还没有明确的指导方针,因为人工智能在没有参考内容的情况下无法生成内容。

接下来,我们将探讨生成式人工智能搜索对搜索引擎的影响。

生成式人工智能搜索对搜索引擎的影响

以下是生成式人工智能搜索的发展如何影响传统搜索引擎:

  • 谷歌、雅虎、DuckDuckGo和Brave等搜索巨头的人气将大幅下降。
  • 从搜索引擎收取的广告收入也将大幅减少。
  • 免费和公平的网络搜索结果将受到影响,新的收入来源将会出现,网站所有者将向生成式人工智能搜索提供商支付费用,以显示其网页内容。
  • 网站的访问量将大幅减少,因为用户将从不同的页面获取他们需要的内容。

现在,我们将探讨一些使用生成式人工智能搜索的搜索引擎。

使用生成式人工智能搜索的搜索引擎

搜索引擎公司已经意识到基于人工智能的生成式搜索是未来的趋势。因此,各大搜索巨头已经开始推出人工智能搜索引擎的原型和Beta测试版本。以下是一些您可以现在尝试的基于人工智能的搜索引擎:

#1. 必应

微软不仅收购了ChatGPT的开发商OpenAI,还利用OpenAI的专有技术和许可来增强必应搜索的AI功能。改进后的版本通常被称为“新必应”。

该搜索引擎可以帮助您获得真实问题的完整答案,不再需要基于关键词的网站排名和手动清理排名靠前的网站数据。您还可以像与您工作或业务领域中的专家发短信和聊天一样与搜索引擎进行对话。

搜索引擎的聊天功能允许您提出最多五个后续问题,以微调底层生成式人工智能模型提供的搜索结果。新必应不仅仅用于获取在线网页结果,还可以帮助您解决以下问题:

  • 获取有关各种主题和细分领域的提示。
  • 借助ChatGPT等生成式人工智能工具创作创意内容。
  • 获取直观且准确的搜索结果,以便您可以快速开始工作,而不会被广告和行动号召弹窗所打扰。

#2. 谷歌

多年来,谷歌搜索一直在利用人工智能搜索工具。RankBrain是谷歌在2015年用于网站排名的第一个人工智能工具。该人工智能解释搜索结果,并将相关网站排在排名层次结构的顶端。

谷歌在其搜索引擎中使用的其他人工智能程序包括:

  • 神经匹配,帮助搜索引擎找出查询与页面的相关性。
  • 来自Transformer或BERT的双向编码器表示,用于自然语言处理的预训练。
  • 使用手机或平板电脑相机进行对象搜索的Google Lens。
  • 用于网络结果中COVID-19疫苗信息的多任务统一模型或MUM。

#3. You

You是一款可立即投入使用的AI搜索引擎工具。用户可以使用它来获得丰富的搜索结果,如下所述:

  • 它在搜索结果页面(SERP)的顶部显示了应用程序、工具和结果的数量。
  • “人们也问”结果会在右侧面板中弹出。
  • 获取有关YouChat的建议。
  • 它显示了来自Reddit等权威社交媒体的热门讨论卡片。
  • 用户还可以在同一搜索中添加更多查询。

目前提供的AI搜索产品包括:

#4. 涅瓦

Neeva是一款基于人工智能的在线研究或网站搜索工具。它通过在搜索结果页面中省略广告来帮助您获得无干扰的结果。您在Neeva搜索框中输入一个封闭式问题,它会为您提供一个接近完美的逐步答案。与谷歌搜索不同,Neeva的搜索结果上方不会出现广告。

Neeva是一个由订阅者资助的在线搜索工具。它从定期使用该应用程序进行在线搜索的用户那里获得收入,而不是像谷歌那样依赖广告收入。因此,您可以预期它在您付费时会通过上下文搜索结果更好地为您服务。

作者的话

基于人工智能的生成式搜索引擎可能成为在线研究的一大难题。一旦这些公司开始计划通过从某些网站或出版商那里获得报酬来推广内容,在线搜索就会变得非常不公正。

人工智能搜索引擎开发人员必须成立一个联盟,制定道德准则,以确保自由和公正的搜索实践。

本文已经详细讨论了生成式人工智能搜索的定义、它与传统网站搜索概念的区别及其影响。此外,还探讨了生成式人工智能搜索工具的新颖例子,这些工具可以让您在网站研究上花费的时间最少,从而获得优质的内容。

本文将帮助您了解是否应该使用基于人工智能的搜索。然而,基于生成式机器学习的万维网人工智能搜索将成为新的趋势。

接下来,请查看人工狭义智能(ANI)。