Meta震撼发布Llama 3,一夜重回开源大模型铁王座

AI百科4个月前发布 快创云
85 0

  Meta发布最新开源大模型Llama 3,8B与70B版本免费供开发者使用,即将登陆主流云供应商。据Meta称,这两个版本在同体量下性能最佳,其中Llama 3 8B在部分测试集上表现甚至优于Llama 2 70B。未来几个月内,Meta还将推出更多版本,包括可能达到GPT-4级别的Llama 3-400B以上版本。传奇研究员吴恩达称其为收到的最好礼物。

  Llama 3基于超过15T token训练,是Llama 2数据集的7倍多,训练效率高出3倍,支持8K长文本,并在多个重要基准测试中表现出最先进性能。此外,Llama 3还增强了推理和代码能力,并引入了新版信任和安全工具,提升了安全性。

  根据Meta AI工程师Aston Zhang透露,Llama 3项目始于去年夏天,团队在数据集和预训练等方面取得了突破。未来,Llama 3还将解锁更长上下文、多模态支持以及性能更强的400B版本。用户现在可以在HuggingChat上体验Llama 3。

  虽然Llama 3在多项基准测试中领先同行,但优势并不明显。Meta展示的测试结果包括MMLU、ARC、DROP等,显示Llama 3 8B在九项测试中领先。然而,在引用的一些基准测试中,Llama 3 8B的得分仅略高于Mistral 7B和Gemma 7B。在MMLU、HumanEval和GSM-8K上,Llama 3 70B击败了Gemini 1.5 Pro,但无法与Anthropic的Claude 3 Opus媲美。

  Meta表示其目前最大的模型参数已超过4000亿(400B),但仍在训练中。虽然尚未决定是否开源400B版本,但Llama 3的发布已让Meta重新成为开源社区的领先者。其优越性能得益于15万亿token的庞大数据集训练,几乎是Llama 2的七倍。同时,Meta还优化了训练流程,提高了训练效率。

  除了性能提升外,Llama 3还带来了全新的Meta AI助手。据Meta CEO扎克伯格介绍,Meta AI是目前最智能的免费AI助手,可在Instagram、Facebook等APP中直接使用。此外,Llama 3还具备文生图功能,生成图片速度快且质量高。

  针对安全性问题,Meta采用了新的系统级方法来开发和部署Llama 3,并引入了指令微调技术来确保模型安全。此外,还采用了业内先进的大模型安全技术,包括Llama Guard 2、Code Shield和CyberSec Eval 2等新版信任和安全工具。

  总之,Meta在开源大模型领域继续取得进展,Llama 3的发布不仅提升了性能和安全性,还为用户带来了更智能的AI助手体验。未来,Meta还将继续披露更多技术细节并与外界进行交流。

© 版权声明

相关文章