OpenAI迎东方劲敌？这家中国大模型公司震动硅谷_

中国AI公司的创造力正技惊四座。最近几天，一家名为深度求索（DeepSeek）的中国公司在欧美AI圈引起了不小的震动。

1月24日，美国消费者新闻与商业频道CNBC发文称，DeepSeek的AI模型“威胁美国在AI领域的主导地位”。同日，华尔街顶级风投A16Z创始人马克·安德森在社交媒体发言称，DeepSeek R1是其见过的最令人惊叹，最令人印象深刻的突破之一，并且是开源的，是给世界的礼物。英伟达资深科学家、AI智能体业务负责人Jim Fan也对其给予了高度评价。

另据媒体报道，Meta（前身为 Facebook）员工在美国匿名职场社区teamblind上发帖提到，DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌，工程师正在疯狂地分析DeepSeek，试图从中复制任何可能的东西。在此前，OpenAI前政策主管、Anthropic联合创始人杰克·克拉克表示，其认为DeepSeek“雇佣了一批高深莫测的奇才”，还认为中国制造的大模型“将和无人机、电动汽车一样，成为不容忽视的力量。”一些国外的科技博客也对DeepSeek进行了连篇累牍的报道。

让欧美科技、创投圈大佬及媒体不吝溢美之词的中国大模型公司，究竟强在哪里？

几天前，总部位于中国杭州的DeepSeek发布推理模型R1，在性能逼近 OpenAI o1正式版的同时，推理成本却仅为后者的几十分之一。

纽约时报称，DeepSeek大模型以极低成本（600万美元）和少量芯片（2000块）实现了与OpenAI等巨头相媲美的性能，挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

低成本实现高性能模型研发，对用户来说的体验感也立竿见影——它功能强大，但却免费使用，并且DeepSeek还将代码面向开发者进行了开源。

“GPT o1一个月得200美元呢，DeepSeek能力强还完全免费，强啊，省钱了。”有网友评论道。还有人表示，自己近期通过DeepSeek的模型写代码，表现比GPT更好。

记者体验发现，登陆DeepSeek官网或手机APP，就能通过“深度思考”这个功能来体验DeepSeek R1的能力。

当记者在与DeepSeek的对话框中问道：“DeepSeek R1模型的发布，与英伟达股价下跌有什么关系？”DeepSeek将其针对此展开思考的过程，如“用户为何会认为英伟达股价下跌、DeepSeek R1模型这两个时间会有关联”、“英伟达的股价受哪些因素影响”、“ R1模型可能影响其股价的原因”等各维度进行了逻辑严密的分析，并围绕技术趋势的潜在影响、市场情绪与预期管理、行业生态的简介关联等层面给出了精要的阐述和结论。

在使用测试的过程中，R1既能用动画解释量子力学，轻松应对脑筋急转弯，也能用缜密的逻辑来回答电车难题等各种问题。

据了解，DeepSeek R1没有使用业内普遍使用的监督微调（SFT）训练范式，而是直接通过强化学习让模型自主进化出复杂的推理能力，包括反思和长链思考等能力。这种方法不仅提高了训练效率，还减少了对昂贵计算资源的依赖。与 OpenAI 的o1相比，DeepSeek模型的百万token输入成本从15美元锐减到0.55美元，输出成本则从60美元降低到2美元。

由于通过技术创新减轻了对算力的过度依赖，甚至有股民将芯片巨头英伟达周五下跌的原因指向DeepSeek R1模型的发布。还有人提出，DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。

业内人士认为，DeepSeek的出现预示着中国AI产业正从“跟随创新”转向“范式创新”，全球AI竞争进入技术多极化时代。“我相信如果未来要对抗美国的AI技术霸权，中国的大模型技术’复仇者联盟’战队里一定有DeepSeek一份。”360创始人周鸿祎说。

来源：北京日报客户端