界面新闻记者 | 李彪
界面新闻编辑 | 文姝琪
来自中国的AI初创公司DeepSeek震惊美国科技界,引发硅谷巨头连夜开会讨论后,后续影响进一步波及到了华尔街。
1月27日美股交易日,美股三大指数开盘齐跌。至收盘有小幅回升,道琼斯指数涨0.65%,纳斯达克指数跌3.07%,标普500指数跌1.46%。
而因为DeepSeek“只用不到十分之一的算力训练出了可媲美硅谷巨头的AI模型”,再度引发了市场对“算力过剩”的泡沫恐慌。算力相关的半导体股在这次美股暴跌中遭受重创,英伟达跌近17%,博通跌超17%,台积电跌超13%,阿斯麦跌超5%。硅谷科技巨头则有跌有涨,微软跌2.14%,谷歌跌4.03%,特斯拉跌2.32%;苹果涨3.25%,Meta涨1.91%,亚亚马逊涨0.3%
虽然市场并未将这次美股暴跌的原因直接归结为DeepSeek的冲击,但后者引发的低成本算力浪潮已在中美科技界都引发热议。
根据美国匿名职场社区teamblind上的一位Meta员工爆料,DeepSeek去年12月发布V3模型后,Meta内部陷入恐慌。这款模型与Meta旗下的开源模型Llama-3.1同为开源模型,性能大致相当,但算力训练成本只有其十分之一不到。这位Meta员工称,两家巨大的落差令Meta管理层向董事会难以解释“巨额成本开支的合理性”,公司内部已组建了多个小组来研究DeepSeek的技术细节,一众工程师正在加班加点地分析,
作为如今市面上算力的主要提供者,英伟达这次也首当其冲受到影响。短短一个交易日其股价暴跌16.86%,市值蒸发近6000亿美元,创下美股单日最大跌幅纪录。
根据DeepSeek-V3论文介绍,DeepSeek训练模型使用了2048张英伟达H800 GPU,就达到了竞争对手用16000张英伟达H100 GPU(H800为H100对华出口禁售的降配版,性能约为其一半)的模型训练效果。DeepSeek这种低成本模式令华尔街开始产生恐慌:未来一旦推广开来,科技公司是否还需要持续大量购入英伟达先进的AI芯片支持模型开发?硅谷巨头前两年斥巨资建设AI数据中心等基础设施是否等于泡沫?
英伟达则不认同这种过度恐慌的泡沫论。根据路透社1月28日最新报道,英伟达在当日股价暴跌后发声明称,"DeepSeek的进步反而证明了市场需要更多AI芯片"。英伟达认为, 在中国大陆算力资源受限的环境下,DeepSeek主要通过在模型推理阶段运用了创新的技术。而AI推理仍然需要大量英伟达GPU和高性能网络。
更为重要的是,巨头用于AI基建的资本开支今年并没有放缓的迹象,反而持续升高。上周五,Meta首席执行官马克·扎克伯格在社交媒体宣布,Meta2025年资本支出将达到600亿-650亿美元的规模,相比2024年增加接近一倍,重点用于AI基建。微软、谷歌此前也都已经表态将在今年继续增加资本支出。
当前,英伟达基于新一代BlackWell架构的B200芯片正处于量产出货的关键期。按照公司的说法,客户对新品的需求可以用“疯狂”形容,今年连续几个季度都将“供不应求”。可以预见的是,在未来相当长的一段时间内,AI算力芯片的需求依旧维持在高位,英伟达的市场地位难以撼动。
但DeepSeek所引发的低成本算力浪潮确确实实给业界带来了冲击。虽然各家研究破解DeepSeek并没有得出统一结论,但其所用到的一些创新技术行业探索降低模型开发成本带来了新思路。
根据DeepSeek开发团队介绍,V3模型采用了模型压缩、专家并行训练、FP8混合精度训练等一系列创新技术降低成本。
以FP8为例,FP8是指使用8位浮点数格式,相比于传统的16位的FP16和32位的FP32,FP8是一种新兴的低精度训练方法,通过减少数据表示所需的位数,显著降低了内存占用和计算需求。此前多位AI行业人士告诉记者,DeepSeek用到的FP8技术是一大亮点,也是其能够做到低成本训练的一项关键技术。目前除了DeepSeek,国内公司如零一万物,国外的谷歌、Inflection AI都已将这种技术引入模型训练与推理中。
而引入FP8后,也有可能导致模型计算导致在某些情况下精度不足,造成性能不稳定,需要开发团队去进一步调优。DeepSeek在这项技术的应用上有其独到之处。
国内GPU公司摩尔线程相关负责人告诉记者,DeepSeek团队在实践中使用FP8训练,充分利用了FP8带来的计算和传输优势,同时为了缓解FP8训练出现不稳定的情况,DeepSeek团队仅在模型一部分使用FP8,并在使用时对激活和权重做了细致的设计,这样在尽可能保证训练精度的情况下可以利用到FP8带来的计算和成本优势。
上述负责人认为,DeepSeek的确让行业燃起了使用FP8进行大模型预训练的热情。摩尔线程目前的GPU产品以及自家的夸娥万卡AI算力集群都已支持FP8技术。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有