Meta公司最近发布了一项科技重磅成果,即其全新的开源模型——Llama3
Meta公司最近发布了一项科技重磅成果,即其全新的开源模型——Llama3。此模型以两种参数规模亮相:8B(80亿参数)与70B(700亿参数),并定于今年7月正式登场。令人瞩目的是,Llama3不仅具备强大的多模态能力,还新增了计算机编码功能,这意味着它可以同时输出文本和图像,预示着未来在雷朋Meta智能眼镜等设备上的广泛应用。
Meta与谷歌强强联手,将谷歌的实时搜索结果融入AI助手的回答中,为用户带来更为丰富和即时的体验。相较于其前身Llama2,Llama3在众多行业基准评测中均展现了卓越的性能,特别是在推理、代码生成以及指令跟踪方面取得了重大突破。为了打造出这一杰出模型,Meta动用了包含2.4万个GPU的两个集群,其中1.6万个GPU被同时投入到Llama3的训练中。
Llama3的研发彰显了Meta在AI领域的远大抱负。目前,公司正在积极开发参数规模超过400B的超大模型。Llama3的主要特点包括:
模型规模与类型:提供8B和70B两种规模的模型,专为对话和其他语言处理任务进行了优化。 模型架构:采用创新的自回归方法和优化的变换器架构,通过引入分组查询注意力机制,显著提升了大规模参数模型下的推理可扩展性。 训练与数据处理:利用超过15万亿的tokens进行预训练,其训练集规模是Llama2的七倍,并支持多达30种语言。 性能与基准测试:在多个自动化基准测试中成绩斐然,涵盖对话、问答、推理等多项任务,且特别针对现实场景进行了优化。
此外,Meta还推出了基于Llama3的AI助手,并已在包括美国在内的十多个国家上线。用户可以在Facebook、Instagram、WhatsApp和Messenger等平台上使用这一智能助手,享受从餐厅推荐到学习辅助等全方位服务。更重要的是,Meta AI现已整合了搜索功能,使用户能够直接获取网络上的实时信息,而无需在应用间切换,极大地提升了用户体验。