2025 年 4 月 6 日,Meta( 偏偏挑在周六)发布了其 Llama 家族的新一批 AI 模型:Llama 4。

这次共有四种新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。
Meta 表示,所有模型都使用“大量未标记的文本、图像和视频数据”进行了训练,从而获得“广泛的视觉理解”。
DeepSeek 的开放模型大获成功,其性能比肩甚至胜过 Meta 之前的旗舰 Llama 模型,据称这刺激了 Meta 加快开发 Llama。
据说 Meta 已紧急设立作战室来解密 DeepSeek 如何降低运行和部署 R1 和 V3 等模型的成本。
Scout 和 Maverick 已在 Llama.com 上公开可用,包括 AI 开发平台 Hugging Face,而 Behemoth 仍在训练中。
Meta 表示,广泛用于WhatsApp、Messenger 和 Instagram 等应用程序中的 AI 助手 Meta AI 已经过更新,可在 40 个国家或地区使用 Llama 4。
目前,多模态功能仅限于美国市场的英文版。
一些开发人员可能会对 Llama 4 许可证提出异议。
“注册地”或“主要营业地点”在欧盟的用户和公司被禁止使用或分发这些模型,这可能是欧盟地区的 AI 和数据隐私法律规定的治理要求的结果。(过去,Meta 曾炮轰这些法律过于繁琐。)

此外,与之前的 Llama 版本一样,月活跃用户超过 7 亿的公司必须向 Meta 申请特殊许可证,Meta 可自行决定授予还是拒绝许可证。
Meta 在一篇博文中写道:“这些 Llama 4 模型标志着 Llama 生态系统开始迎来一个新时代。这只是 Llama 4 系列的开始。”

Meta 表示,Llama 4 是其第一批使用混合专家(MoE)架构的模型,这种架构拥有更高的计算效率,便于训练和回答查询。
MoE 架构基本上将数据处理任务分解为多个子任务,然后将它们交给更小、更专门的“专家”模型处理。
比如说,Maverick 共有 4000 亿个参数,但只有 170 亿个活跃参数,却有128 个“专家”。(参数大致对应于一个模型解决问题的技能。)Scout 有 170 亿个活跃参数、16 个专家和 1090 亿个总参数。
据 Meta 的内部测试结果显示,Maverick 在某些编程、推理、多语言、长上下文和图像等基准测试中的表现超过了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。
该公司声称,Maverick 最适合创意写作等“一般助理和聊天”用例。
然而,Maverick 还无法与谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更强大的最新模型相提并论。

Scout 的优势在于处理文档摘要和大型代码库推理等任务。其独特之处在于,它有一个非常大的上下文窗口:1000 万个 token。(token 代表原始文本的片段,比如说“fantastic”这个单词分成了“fan”、“tas”和“tic”。)

简而言之,Scout 可以接收图片和多达数百万个单词,从而能够处理篇幅极长的文档。
据 Meta 估算,Scout 可以在单单一块英伟达H100 GPU 上运行,而 Maverick 需要英伟达 H100 DGX 系统或同等系统。
Meta 尚未发布的 Behemoth 将需要功能还要强大的硬件。
据该公司声称,Behemoth 拥有 2880 亿个活跃参数、16 个专家和近两万亿个总参数。

Meta 的内部基准测试显示,在衡量 STEM 技能(比如数学问题解决)的几项评测中,Behemoth 的表现压倒 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不如 2.5 Pro)。
值得注意的是,Llama 4 模型中没有一个像 OpenAI 的 o1 和 o3-mini 那样采用正宗的“推理”模型。推理模型会核对答案的真实性,并且通常能更可靠地回答问题,但因此需要花比传统的“非推理”模型更长的时间来提供答案。

值得关注的是,Meta 表示,它对所有 Llama 4 模型进行了调整,以便不再频繁地拒绝回答“有争议”的问题。
据该公司声称,Llama 4 会回答“有争议”的政治和社会话题,而之前的那批 Llama 模型拒绝回答。此外,该公司表示,Llama 4 在拒绝回答哪些提示方面“明显更加平衡”。
Meta 发言人称:“您可以指望 Llama 4 提供有帮助的、事实性的回答,它并不做出任何判断。我们正继续提高 Llama 的响应能力,以便它能够回答更多的问题,能够回应各种不同的观点,并且不会偏袒某些观点。”


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有