Meta成立研究小组深入分析国产大模型DeepSeek,以优化Llama模型

Meta成立研究小组深入分析国产大模型DeepSeek,以优化Llama模型
2025年01月27日 14:49 DoNews

据Information网站报道,Meta近日成立了四个专门研究小组,旨在深入分析国产大模型DeepSeek的工作原理,并以此为基础优化其旗下大模型Llama。其中,两个小组专注于研究幻方量化如何降低DeepSeek的训练和运行成本;第三个小组则探索其可能使用的训练数据;第四个小组则致力于基于DeepSeek的模型属性开发新技术,以重构Meta的模型架构。

1月20日,幻方量化正式发布了DeepSeek-R1推理大模型。该模型在后训练阶段大规模采用了强化学习技术,在标注数据有限的情况下显著提升了推理能力,在数学、代码及自然语言推理等任务中表现优异,性能与OpenAI的o1正式版相当。此外,DeepSeek应用近日在苹果中国区和美国区应用商店免费App下载榜中登顶,甚至在美国区超越了ChatGPT。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部