“震惊硅谷”的中国App登顶两个榜单!美区苹果下载榜超ChatGPT…

“震惊硅谷”的中国App登顶两个榜单!美区苹果下载榜超ChatGPT…
2025年01月27日 13:15 北京商报

在过去的一周中,中国的人工智能大模型是硅谷乃至全世界科技人士热议的话题。而引爆这一讨论的是中国的人工智能初创公司深度求索(DeepSeek)。据媒体报道,该公司上周发布的推理大模型DeepSeek-R1因其可比肩OpenAI o1的性能、极低的服务价格,以及代码和模型架构的完全开源,震惊业界。

1月27日,DeepSeek概念盘初走强。据财联社报道,每日互动、航锦科技、南威软件、美格智能竞价涨停,飞利信、卓创资讯、思特奇高开超10%。消息面上,Deepseek应用1月27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。此前AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。

媒体报道显示,1月26日,DeepSeek就在美国地区苹果应用商店免费榜升至第六位,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。当日,DeepSeek还出现了短时闪崩现象。DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。官方状态页并未将这一事件标记为事故。

据澎湃新闻,1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。

作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。

从目前已有的媒体公开报道中可以看出,DeepSeek团队最大的特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。

另据第一财经报道,多位知名科技人士均对DeepSeek近期取得的成就表示赞叹。AI科技初创公司Scale AI的创始人亚历山大·王(Alexandr Wang)称,过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。

加州大学伯克利分校计算机科学教授伊恩·斯托伊卡(Ion Stoica)对第一财经记者表示,DeepSeek-R1和DeepSeek-V3已经表明,只需花费训练GPT、Gemini和 Claude等现有大模型的一小部分成本即可获得最先进的结果。他还表示在该校的大模型排行榜中,DeepSeek-R1在包括开源模型和专有模型的所有模型中排名第三。

更重要的是,这一成就是在美国对华芯片出口管制加强的背景下实现的。“限制条件和资源匮乏往往会激发创新,这里的情况似乎就是如此。”斯托伊卡对第一财经表示。

编辑丨汪乃馨 北京商报综合财联社、第一财经、澎湃新闻图片丨DeepSeek官网截图、苹果免费App排行榜截图、东方财富截图、视觉中国、壹图网

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部