核心要点
- ChatGPT 的成功激发了对人工智能领域研究和整合的广泛投入,为该领域带来了前所未有的机遇和发展。
- 运用向量数据库的语义检索正在革新搜索算法,通过运用词嵌入和语义来提供上下文更精准的搜索结果。
- 人工智能代理和多代理初创公司的兴起,旨在通过多个代理之间的自我评估、修正和协作,实现完全自主并克服当前的局限性。
ChatGPT 的巨大成功促使每家科技企业都开始加大对人工智能研究的投入,并探索如何将人工智能技术融入到他们的产品中。这种情况前所未有,而人工智能的发展才刚刚起步。
但这不仅仅是关于花哨的人工智能聊天机器人和文本到图像生成器。一些极具前瞻性但也令人印象深刻的人工智能工具正呼之欲出。
利用向量数据库进行语义搜索
图片来源:Firmbee.com/ Unsplash
语义搜索查询正在测试中,旨在为用户提供更优质的搜索结果。目前的搜索引擎采用以关键词为中心的算法向用户呈现相关信息。然而,过度依赖关键词会带来一些问题,例如对上下文理解的不足、营销人员利用搜索引擎优化以及因难以表达复杂查询而导致的搜索结果质量下降。
与传统的搜索算法不同,语义搜索在提供搜索结果之前,会运用词嵌入和语义映射来理解查询的上下文。因此,语义搜索并非依赖于一堆关键词,而是基于给定查询的语义或含义来提供结果。
语义搜索的概念已经存在相当长一段时间。然而,由于语义搜索速度缓慢且耗费大量资源,企业很难实现此类功能。
解决方案是将向量嵌入进行映射,并存储在大型向量数据库中。这样做可以显著降低计算能力的需求,并通过将结果范围缩小到最相关的信息来加快搜索结果的速度。
诸如 Pinecone、Redis 和 Milvus 等大型科技公司和初创企业目前正在投资向量数据库,以便为推荐系统、搜索引擎、内容管理系统和聊天机器人提供语义搜索功能。
人工智能的普及化
虽然不一定属于技术上的进步,但多家大型科技公司对人工智能的普及化抱有浓厚的兴趣。无论好坏,开源人工智能模型现在正被积极训练,并为各个组织提供了更加宽松的使用和微调许可。
《华尔街日报》报道,Meta 正在购买 Nvidia H100 AI 加速器,旨在开发一种能够与 OpenAI 最近的 GPT-4 模型相抗衡的人工智能系统。
目前,还没有任何公开的 LLM 可以达到 GPT-4 的原始性能水平。但随着 Meta 承诺推出具有更宽松许可的竞争产品,企业最终将能够微调强大的 LLM,而无需承担商业机密和敏感数据被暴露和滥用的风险。
人工智能代理和多代理初创公司
图片来源:Anne Spratt/Unsplash
目前,多个实验项目正在进行中,旨在开发无需太多指令即可实现特定目标的人工智能代理。您可能还记得 Auto-GPT 中的人工智能代理概念,它是一种能够自动执行操作的人工智能工具。
核心理念是让代理通过持续的自我评估和自我修正来实现完全的自主。实现自我反思和纠正的工作机制是:代理在每一步中不断提示自己需要做什么、如何做、犯了哪些错误以及有哪些可以改进的地方。
然而,当前人工智能代理中使用的模型几乎缺乏语义理解能力。这会导致代理产生幻觉并输出错误信息,从而陷入自我评估和自我修正的无限循环中。
像 MetaGPT 多代理框架这样的项目旨在通过同时使用多个人工智能代理来减少此类幻觉,从而解决这个问题。多代理框架的构建是为了模拟初创公司的运作方式。在该初创公司中,每个代理将被分配不同的角色,例如项目经理、项目设计师、程序员和测试员等。通过将复杂的目标分解为较小的任务,并将这些任务委托给不同的人工智能代理,它们更有可能实现既定的目标。
当然,这些框架仍处于早期开发阶段,还有许多问题需要解决。但随着更强大的模型、更好的人工智能基础设施以及不断的研发,有效的人工智能代理和多代理人工智能公司成为现实只是时间问题。
用人工智能塑造我们的未来
大型企业和初创公司都在大力投资人工智能及其基础设施的研发。因此,我们可以预见生成式人工智能的未来将通过语义搜索、完全自主的人工智能代理和人工智能公司,以及免费提供的高性能模型,供企业和个人使用和微调,从而更好地获取有价值的信息。
虽然这一切令人兴奋,但我们也需要花时间思考人工智能伦理、用户隐私以及人工智能系统和基础设施的负责任开发。让我们记住,生成式人工智能的发展不仅仅在于构建更智能的系统,还关乎重塑我们的思维,并以负责任的方式使用技术。