Meta 的 Llama 2:开源大型语言模型的崛起
当像“Llama 2”这样具有开创性的技术出现时,Meta公司自然不会错过利用其潜力的机会。这次,他们推出了一款属于自己的聊天机器人。
Llama 2,作为Meta公司自家的大型开源语言模型,正准备在人工智能领域掀起一场变革,其地位堪比早期的GPT-3。
这款新型人工智能有可能对ChatGPT构成直接竞争,主要原因在于其免费使用特性,并且为人工智能研究的进一步突破铺平了道路。然而,Llama 2所提供的远不止这些。本文将深入探讨Llama 2的各个方面。
Meta:引领元宇宙革命
首先,我们来回顾一下Llama 2背后的公司:Meta Platforms Inc.。这家公司曾经被称为Facebook,或许你依然记得这个名字。
Meta公司以约7723.3亿美元的市值,位居科技巨头之列,主要专注于社交媒体和科技产品的研发。旗下拥有包括Facebook、Instagram、WhatsApp、Threads和Messenger等一系列热门社交媒体和通讯应用。
Meta公司备受瞩目的项目是元宇宙的开发,这是一个融合物理、增强和虚拟现实的共享虚拟空间。该愿景包括开发虚拟现实(VR)和增强现实(AR)技术、沉浸式体验,以及允许用户以全新沉浸方式互动的数字生态系统。
随着OpenAI的GPT模型和谷歌的PaLM 2相继推出,Meta公司看到了展示自身实力、分羹人工智能市场的机会。
阅读更多:智能手机必备人工智能应用
Llama 2简介
Llama 2是由Meta和微软联合开发的开源大型语言模型,旨在满足研究和商业需求。虽然这种合作看似不同寻常,但两家公司都致力于在人工智能领域取得突破,所以携手对抗共同的挑战也是一种策略。最终的成果是一个功能强大且免费使用的大型语言模型。
由于其免费特性,Meta公司已成为人工智能开放创新的重要贡献者。尽管Llama 2的工作原理与GPT-3和PaLM 2等其他大型语言模型相似,但其开发思路具有共通之处。
该平台使组织和开发者能够不受限制地创建生成式人工智能工具和体验。
尽管在技术细节方面,它与其他竞争对手的区别尚不明确,但与那些闭源代码不同,它是开源且免费的。
Llama 2 的工作原理
Llama 2模型接受了两万亿“tokens”的训练,这些数据来自公共资源,如维基百科、Common Crawl 和古腾堡计划的公开书籍,从而构建其神经网络。 每个token代表一个单词或一个语义片段,使模型能够理解不同文本的含义并预测后续文本。
在训练人工智能模型时,开发人员采用了多种策略,包括基于人类反馈的强化学习(RLHF),从而鼓励系统做出有益的响应并产生更令人满意的结果。
更重要的是,你可以通过你的个人风格、专业风格、品牌形象和特点的例子来训练该模型,从而创建品牌故事。 该模型只是你根据需要构建表单的基础。该模型的聊天机器人也经过了数据训练和微调,使其能够以最自然的方式响应提示。
运行 Llama 2 的系统要求
要运行此程序,您至少需要 7B 模型和 10GB 的 VRAM,尽管 8GB 也可能适用。
以下是在本地运行 Llama 2 的一些先决条件:
- Python: 需要 Python 3.8 或更高版本,推荐使用 3.11
- Git:需要安装 Git
要尝试 Llama 的任何版本,唯一的选择是访问Hugging Face,这是开源人工智能模型的主要中心。通过该平台,您还可以尝试 Llama 2 7B Chat。如果您具备支持其运行的硬件规格,可以申请访问 Meta,并提供您的详细信息,以便了解 Llama 的后续版本。
Llama 2 与 GPT 和 Bard 的比较
Llama 2 与 GPT 和 Bard 的人工智能模型属于同一阵营。Llama 的研究人员发表了一篇论文,详细介绍了该人工智能模型的各个方面,包括如何根据一些常用基准(例如 TriviaQA 阅读理解数据集和多任务语言理解)与同类产品进行比较。
该研究比较了多个开源和闭源模型,如 GPT-3.5、GPT-4、PaLM 和 PaLM 2。
研究结论表明,Llama 的 70B 版本在性能上优于其他开源大型语言模型。虽然它在大多数参数上似乎与 GPT-3.5 和 PaLM 的性能相当,但其表现不及 GPT-4 或 PaLM 2。
在实践中,Llama 2 在生成结果时会更多依赖想象力。另一方面,ChatGPT 的输出可能更加高级和富有创意,特别是当你使用其最新付费版本时。
但这正是 Llama 的优势所在:它可以免费使用并且是开源的。企业可以访问并使用官方 API 来微调模型,从而促进独特的响应。
总结
目前来看,Llama 2 可能不是最先进的大型语言模型。但其独特之处在于,与闭源竞争对手不同,它是开源的,任何人都可以免费使用。这款人工智能工具的推出是开放创新的一大飞跃;由于 Llama 易于使用,公司可以更方便地尝试和创建他们可以控制的人工智能驱动工具和应用程序。
任何人都可以访问它,但许可的唯一限制是,每月用户超过 7 亿的公司必须申请特殊许可才能使用 Llama。这意味着大型科技公司,以及Meta和微软的直接竞争对手,如谷歌、亚马逊和苹果,在访问上可能会遇到困难。因此,这似乎赋予了小型公司更多的权利!
接下来,请查看一份最强大的人工智能工具列表,以备将来参考。