“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得Llama 4在基准测试中已经落后……”近日,一位来自Meta的工程师在相关社区网站如是写道。一时间,有关DeepSeek “威胁美国主导地位”“引发硅谷恐慌”等言论迅速席卷整个欧美AI圈。
或许没人想到,一家刚成立一年半、去年才发布第一个大模型的年轻公司,能给全球科技带来如此震撼。就在最近一个月内,DeepSeek(深度探索)先后发布了DeepSeek-V3和DeepSeek-R1两款大模型。从当前测试看,DeepSeek-R1在数学、代码和自然语言推理等任务上“媲美巨头”,甚至部分超越了被誉为“最强推理模型”的OpenAI o1。比如,在AIME 2024数学基准测试中,DeepSeek-R1的得分率为79.8%,OpenAI-o1的得分率为79.2%。更令人惊喜的是,相比于众多国际顶尖大模型动辄上千万美元的预训练成本,DeepSeek-R1的预训练费用仅为550万美元,且硬件限制之下,整个训练是在“性能一般”的英伟达H800 GPU集群上完成的。
有观察人士以“墙内开花遍地香”形容DeepSeek。众所周知,为确保技术霸权、遏制他国发展,美国在芯片领域对中国的制裁力度近乎疯狂。就在今年开年,还将中国列入“Tier 3级管控”,几乎切断高端AI芯片的供应链。可以说,国内AI产业上下游的公司面临供应链受阻、研发受限、发展成本增加等重重挑战。即便在这样的极限逆境中,DeepSeek还是走出了自己的路,并允许研究者和开发者在自己的项目中自由使用该模型,允许用户对模型进行任何形式的修改和衍生创作。开放姿态为全球AI社区带来宝贵资源,更给了那些企图靠封锁维持技术优势者一记响亮耳光。正如英伟达科学家Jim Fan表示,“我们生活在这样一个时代:由非美国公司保持OpenAI最初的使命——做真正开放的前沿研究、为所有人赋能。”
DeepSeek还是新生力量,后续会有怎样的表现,我们还要以平常心看待,不骄不躁,静待花开。说起来,从2022年ChatGPT横空出世,到Sora、GPT-4o等AI产品火爆全球,人工智能领域浪潮汹涌,人类共同见证了科技的力量。可对我们而言,这期间,“又一次被别人甩在身后”的拉踩之声不绝于耳,“中国为何没有原始创新”的“惯性反思”接踵而来。事实真如一些人所言吗?客观来看,美国通过高性能GPU芯片在算力方面确实占据优势,但在政策支持与产业布局的双重驱动下,我国的人工智能生态同样渐趋成熟。每家企业都在寻找自己的发展路径,万千科技工作者更始终在奋力攀登,对前沿科技的“深度探索”,中国从不会缺席。
我们清醒地知道,中国科技在许多领域较世界先进水平尚存在差距,在关键环节还有很多被“卡脖子”的地方。但从两弹一星到北斗导航,从风洞技术到量子通信,我们哪一次不是在步步摸索中前行,哪一次不是在屡屡跌倒后站起?也是在承认差距、奋起直追的历程中,我们验证着“路虽远行则将至”的箴言,展现着“达则兼济天下”的胸怀。
最美好的故事永远是“下一个”。DeepSeek创始人在采访中表示,“中国的AI不可能永远跟随……需要有人站到技术的前沿。”可以预见,全球化遭遇逆流之际,人工智能以及更多领域的封锁打压仍会如影随形。国内也总有那么一撮逢西必捧、逢中必踩之人,西方任何风吹草动都会成为其“敲打”中国的素材。对我们来说,不因冷言冷语自怨自艾,不为一时成果盲目自嗨,创造包容的土壤,耐住长期的苦寒,永远坚持把自己的事做好,向前沿进发、向深处探索的脚步才能更加坚实。
图源:视觉中国
来源:北京日报客户端
流程编辑:U022
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有