Meta成立研究小组深入分析国产大模型DeepSeek，以优化Llama模型_

据Information网站报道，Meta近日成立了四个专门研究小组，旨在深入分析国产大模型DeepSeek的工作原理，并以此为基础优化其旗下大模型Llama。其中，两个小组专注于研究幻方量化如何降低DeepSeek的训练和运行成本；第三个小组则探索其可能使用的训练数据；第四个小组则致力于基于DeepSeek的模型属性开发新技术，以重构Meta的模型架构。

1月20日，幻方量化正式发布了DeepSeek-R1推理大模型。该模型在后训练阶段大规模采用了强化学习技术，在标注数据有限的情况下显著提升了推理能力，在数学、代码及自然语言推理等任务中表现优异，性能与OpenAI的o1正式版相当。此外，DeepSeek应用近日在苹果中国区和美国区应用商店免费App下载榜中登顶，甚至在美国区超越了ChatGPT。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。