OpenAI迎东方劲敌?这家中国大模型公司震动硅谷

OpenAI迎东方劲敌?这家中国大模型公司震动硅谷
2025年01月26日 08:43 京报网_北京日报官方网站

中国AI公司的创造力正技惊四座。最近几天,一家名为深度求索(DeepSeek)的中国公司在欧美AI圈引起了不小的震动。

1月24日,美国消费者新闻与商业频道CNBC发文称,DeepSeek的AI模型“威胁美国在AI领域的主导地位”。同日,华尔街顶级风投A16Z创始人马克·安德森在社交媒体发言称,DeepSeek R1是其见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是给世界的礼物。英伟达资深科学家、AI智能体业务负责人Jim Fan也对其给予了高度评价。

另据媒体报道,Meta(前身为 Facebook)员工在美国匿名职场社区teamblind上发帖提到,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,工程师正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。在此前,OpenAI前政策主管、Anthropic联合创始人杰克·克拉克表示,其认为DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型“将和无人机、电动汽车一样,成为不容忽视的力量。”一些国外的科技博客也对DeepSeek进行了连篇累牍的报道。

让欧美科技、创投圈大佬及媒体不吝溢美之词的中国大模型公司,究竟强在哪里?

几天前,总部位于中国杭州的DeepSeek发布推理模型R1,在性能逼近 OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。

纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。

“GPT o1一个月得200美元呢,DeepSeek能力强还完全免费,强啊,省钱了。”有网友评论道。还有人表示,自己近期通过DeepSeek的模型写代码,表现比GPT更好。

记者体验发现,登陆DeepSeek官网或手机APP,就能通过“深度思考”这个功能来体验DeepSeek R1的能力。

当记者在与DeepSeek的对话框中问道:“DeepSeek R1模型的发布,与英伟达股价下跌有什么关系?”DeepSeek将其针对此展开思考的过程,如“用户为何会认为英伟达股价下跌、DeepSeek R1模型这两个时间会有关联”、“英伟达的股价受哪些因素影响”、“ R1模型可能影响其股价的原因”等各维度进行了逻辑严密的分析,并围绕技术趋势的潜在影响、市场情绪与预期管理、行业生态的简介关联等层面给出了精要的阐述和结论。

在使用测试的过程中,R1既能用动画解释量子力学,轻松应对脑筋急转弯,也能用缜密的逻辑来回答电车难题等各种问题。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与 OpenAI 的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。

由于通过技术创新减轻了对算力的过度依赖,甚至有股民将芯片巨头英伟达周五下跌的原因指向DeepSeek R1模型的发布。还有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。

业内人士认为,DeepSeek的出现预示着中国AI产业正从“跟随创新”转向“范式创新”,全球AI竞争进入技术多极化时代。“我相信如果未来要对抗美国的AI技术霸权,中国的大模型技术’复仇者联盟’战队里一定有DeepSeek一份。”360创始人周鸿祎说。

来源:北京日报客户端

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部