Meta公司推出Llama 3:开源大模型的新里程碑,性能媲美GPT-4

2024-04-19 09:05:53来源:威易网作者:

在人工智能技术迅猛发展的今天,Meta公司再次引领潮流,推出了备受期待的开源大模型——Llama 3。这一模型的发布,不仅标志着Meta在AI领域的技术实力,也预示着开源模型在与闭源模型的竞争中迈出了坚实的一步。

在人工智能技术迅猛发展的今天,Meta公司再次引领潮流,推出了备受期待的开源大模型——Llama 3。这一模型的发布,不仅标志着Meta在AI领域的技术实力,也预示着开源模型在与闭源模型的竞争中迈出了坚实的一步。

当地时间4月18日,Meta公司正式发布了Llama 3,这一消息立即在AI界引起了广泛关注。Meta首席执行官马克·扎克伯格宣布,基于Llama 3模型的AI助手现已全面覆盖Instagram、WhatsApp、Facebook等Meta全系应用,并且单独开启了网站,提供图像生成器功能,可根据自然语言提示词生成图片。

\

Llama 3模型在多个关键基准测试中性能优于业界先进同类模型,尤其在代码生成等任务上实现了全面领先。它能够进行复杂的推理,更遵循指令,能够可视化想法并解决许多微妙的问题。Llama 3的主要亮点包括基于超过15T token的训练,支持8K长文本,改进的tokenizer具有128K token的词汇量,以及训练效率比Llama 2高3倍。

目前发布的8B和70B版本的Llama 3模型已用于Meta AI助手,并且面向开发者进行了开源,包括预训练和微调版本。Meta计划在今年推出正式版Llama 3,目前用4000亿个参数进行训练,MMLU得分达到85分。此外,Meta还宣布与谷歌建立新的合作伙伴关系,在助手的答复中包括实时搜索结果。

Llama 3的推出,正值开源与闭源AI模型优劣之争的热议之际。Meta坚定地选择了开源路线,认为开源对社区和公司都有好处,因为可以促进创新。Llama 3的发布,不仅为开源模型扳回一局,也为AI未来的发展提供了新的方向。

Meta表示,Llama 3是在两个定制的24K GPU集群上、基于超过15T token的数据上进行了训练,是迄今为止最强大的Llama模型。公司还计划在未来几个月内推出更多具备多模态、多语言对话、更长上下文窗口等能力的新模型。

Llama 3的发布,不仅是Meta公司在AI领域的一次重大技术突破,也是开源AI模型发展史上的重要里程碑。随着Llama 3的开源,我们有理由相信,它将为全球的AI研究和应用带来深远的影响,推动整个行业向更智能、更开放的未来发展。

关键词:LlamaMetaAI