【文/观察者网 刘程辉】
这些天,中国人工智能公司深度求索(DeepSeek)开发的AI模型犹如一枚重磅炸弹,给西方业界造成的冲击久久未能平息。各大西方媒体乃至AI团队和投资者都想知道:在没有顶尖芯片的情况下,中国人是如何用更低的成本,创造出足以匹敌美国顶尖AI模型的产品的?
“中国新型AI模型DeepSeek如何威胁美国的主导地位。”美国消费者新闻与商业频道(CNBC)1月24日发表报道称,深度求索发布的AI模型不仅性能超越美国顶尖同类模型,且构建成本更低、所用芯片算力也没那么强大,这一消息在硅谷引发恐慌,也让美国人开始担忧——美国在全球人工智能领域的领先地位是否正在缩小,科技巨头在构建人工智能模型和数据中心上的巨额投入真的还值得吗?
CNBC注意到,深度求索于去年12月底推出了一款免费开源的大语言模型DeepSeek-V3。关键的是,中国人仅用了两个月时间,花费不到600万美元,使用英伟达算力稍逊的H800芯片就构建出了这个模型。相较之下,谷歌和OpenAI花费数年时间和数亿美元才取得类似成果。DeepSeek的开源模型已成为许多美国开发者的基础。
在一系列第三方基准测试中,无论是解决复杂问题还是数学和编程等方面,深度求索的模型在准确率上甚至超过了Meta的Llama 3.1、OpenAI的GPT - 4o以及Anthropic的Claude Sonnet 3.5。
在许多第三方测试中,深度求索本周最新发布的推理模型DeepSeek-R1同样超越了OpenAI的最新模型o1。
Deepseek-V3与多个国内外大模型的测试数据对比 “Deepseek”公众号
“深度求索的新模型实在令人印象非常深刻。”微软首席执行官萨蒂亚·纳德拉22日在达沃斯世界经济论坛上感慨,“他们能如此高效地开发出一款开源模型,在推理计算方面表现出色,计算效率极高。我们必须极其严肃地看待中国的这些进展。”
CNBC称,令人瞩目的是,在取得这样出色成绩的背后,是美国政府对中国实施的严格半导体限制,这些限制使中国无法获取英伟达H100等最强大的芯片。中方的最新进展表明,深度求索要么找到了绕过相关规则的方法,要么说明美国的出口管制并未达到华盛顿预期的限制效果。
标杆资本(Benchmark)普通合伙人切坦·普塔贡塔表示:“他们采用优秀的预训练大型模型,并使用蒸馏技术(distillation),利用大型模型来提升小型模型的特定能力,这是一种非常具有成本效益的方法。”
不仅仅是DeepSeek一家。其他中国AI模型也凭借有限资源在竞争中占据了一席之地。李开复的初创公司零一万物.AI成立八个月就成为独角兽公司,2024年创造近1400万美元收入,其模型训练成本仅为300万美元,远低于GPT-4的8000万到1亿美元。阿里巴巴的千问也大幅降低了大型语言模型的成本。
美国AI初创企业Perplexity首席执行官阿拉文德·斯里尼瓦斯说:“需求是发明之母。因为他们必须想出变通办法,结果实际上构建出了效率更高的东西。”
美国《纽约时报》也在1月24日的文章中写到,深度求索开发的AI系统可与OpenAI和谷歌等公司的尖端聊天机器人相媲美,能做到这点本已是一个里程碑,但这个名为DeepSeek-V3的大模型背后的团队描述了一个更大的进步——他们在训练该系统时只用了领先人工智能公司用的高度专业化计算机芯片的一小部分。
自从OpenAI在2022年发布了ChatGPT,引发人工智能热潮以来,许多专家和投资者普遍认为,如果不投入数亿美元购买人工智能专用芯片的话,没有公司能与行业领军者竞争。
世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达1.6万个芯片,甚至更多。但DeepSeek的工程师却说,他们只用了约2000个英伟达生产的专用芯片。
这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片施加限制。
可如今,DeepSeek大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。
DeepSeek聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。关键在于,其造价非常低,打破了只有最大的科技企业(全都在美国)才能制造出最先进的人工智能系统的普遍观念。
根据中国工程师的说法,他们只花了约600万美元的原始计算能力就训练了新模型,不到科技巨头Meta训练其最新人工智能模型所耗资金的十分之一。
乔治华盛顿大学专门研究新兴技术和国际关系的助理教授杰弗里·丁(音)表示,中国进口芯片受到限制,迫使DeepSeek工程师“更有效地训练大模型,以让其仍有竞争力”。
多伦多的技术顾问鲁文·科恩从去年12月下旬起一直在使用DeepSeek-V3。他说,该模型与OpenAI、谷歌,以及旧金山初创公司Anthropic的最新系统能力相当,而且使用起来便宜得多。
“DeepSeek是让我省钱的办法,”他说,“这正是像我这样的人想使用的技术。”
“深度求索的诞生,说明了为什么特朗普很难打赢贸易战。”1月9日,美国乔治梅森大学经济系教授泰勒·考恩在彭博社刊文称,由于美国限制对华出口芯片,深度求索等中企无法获得最新的尖端芯片,因此不得不寻找其他更便宜的方法来训练其模型,并“间接导致了中国重要创新的出现”。
1月23日,英媒《金融时报》刊文《深度求索等中国初创企业正在挑战全球AI巨头》,同样对深度求索给予高度评价。
美国南加州大学古尔德法学院法学教授张湖月(Angela Zhang)在文中提到,深度求索并非孤例。自去年年中以来,阿里巴巴、腾讯、字节跳动等中国科技公司一直在稳扎稳打,逐步缩小与美国同行的差距,在能力上与他们匹敌,在成本效率上超越他们。
“中国在效率方面的成就并非偶然。这是中国对美国及其盟友不断升级的出口限制的直接回应。”张湖月认为,“美国限制中国获取先进的AI芯片,却无意中刺激了中国的创新。”
文章称,这同时暴露了美国旨在阻碍中国AI发展的出口管制的局限性。虽然这些措施可能会造成短期干扰,但随着中国不断创新以适应,其影响只会逐渐减弱。
“对于美国政策制定者来说,一个难以接受的事实是,严格的出口管制迫使中国科技公司变得更加自力更生,从而推动了原本可能不会发生的突破。”文章如此写道。
“深度求索的崛起生动地提醒我们,限制可以促进创新。”文章最后向美国政府提出疑问,“对于特朗普的新政府来说,这提出了一个令人不安的问题:对中国实施越来越严厉的制裁是否会适得其反,加速他们原本想要压制的进步?”
“深度求索的诞生,说明了为什么特朗普很难打赢贸易战。”
1月9日,美国乔治梅森大学经济系教授泰勒·考恩也在彭博社刊文称,由于美国限制对华出口芯片,深度求索等中企无法获得最新的尖端芯片,因此不得不寻找其他更便宜的方法来训练其模型,并“间接导致了中国重要创新的出现”。
本文系观察者网独家稿件,未经授权,不得转载。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有