DeepSeek的崛起与全球AI市场震荡
科技旋涡编辑部
近年来,中国的AI技术在全球舞台上取得了显著突破,尤其是在生成式AI领域。最近,DeepSeek这一来自杭州的初创公司凭借其强大的AI模型和低成本训练方式,在全球科技圈掀起了一股强烈的波澜。
然而,这一切的背后并非风平浪静。随着DeepSeek取得的成绩逐渐被国际间的关注放大,围绕其技术突破和资源积累的阴谋论也应运而生,尤其是美国科技圈对于DeepSeek背后“芯片资源”的质疑。
DeepSeek崛起:技术突破与成本优势
DeepSeek的出现,无疑是中国AI技术发展的一个标志性事件。
作为一家AI初创公司,它在短短时间内发布了多个令人震惊的AI模型,其中最具代表性的就是DeepSeek-V3和DeepSeek-R1。这两款模型不仅在性能上媲美甚至超越了OpenAI的GPT-4和Meta的LLaMA系列,而且在训练和运行成本上,DeepSeek则显示出了明显的优势。
根据行业的说法,V3模型的训练成本仅为不到600万美元,这个价格几乎是OpenAI同类模型成本的零头。
这一技术突破对于全球AI行业的意义非凡。长期以来,AI行业被认为是高算力和巨额投资的代名词,尤其是对昂贵的GPU芯片的依赖,使得像Nvidia这样的半导体巨头受益颇丰。但DeepSeek通过其高效的算法和创新的模型架构,成功打破了这一局面。
这一成就引发了全球范围内对AI算力需求的重新评估,甚至有分析人士预测,DeepSeek的低成本模型意味着,未来AI大模型的训练成本将大幅下降,这对于以Nvidia为首的硬件公司来说,无疑是一次巨大的冲击。
50,000颗Nvidia H100芯片的疑云
然而,DeepSeek的成功并非没有争议。最引人注目的质疑来自美国Scale AI的CEO亚历山大·王(Alexandr Wang)。
他在1月25日接受CNBC采访时表示:“DeepSeek发布了一款性能堪比OpenAI的AI模型,引发了市场恐慌,而这款产品的背后,可能使用了数万颗Nvidia的H100芯片。” 王在采访中进一步称:“DeepSeek显然拥有50,000颗H100芯片,但他们显然不能公开这些信息,因为那会违反美国的出口管制。”
Nvidia的H100芯片是目前市场上最先进的AI训练芯片之一,其强大的计算能力使得它成为全球AI巨头公司进行大规模深度学习训练的首选。然而,根据美国政府的出口管制政策,H100芯片是无法向中国公司销售的。
因此,王的言论立即引发了境外舆论的广泛关注和质疑:DeepSeek是否在绕过出口管制,秘密获取了大量H100芯片?如果真如此,这又意味着什么?这一言论的背后,是否隐藏着对DeepSeek成功的政治动机?
对此,DeepSeek并未立即回应,但外界的猜测和争议却愈演愈烈。虽然DeepSeek的技术突破引人注目,但其背后是否真的存在无法公开的资源和技术来源,已经成为科技圈和国际间的一场博弈。
Janus-Pro:DeepSeek的新突破
1月28日,DeepSeek的最新进展再次震撼了全球AI界。据人工智能社区Hugging Face信息显示,DeepSeek发布了Janus-Pro这一开源的多模态AI模型,并且在多个基准测试中表现不凡,超越了OpenAI的DALL-E 3和Stable Diffusion。Janus-Pro是一款突破性的多模态大语言模型(MLLM),其在视觉理解和生成的能力上展现出独特的优势。
Janus-Pro的设计理念颠覆了传统多模态模型的架构。该模型采用了自回归框架,并将视觉编码分为“理解”和“生成”两个独立路径,极大地提升了生成效果和计算效率。这一架构的创新,解决了以往多模态AI在理解和生成过程中的角色冲突,使得Janus-Pro不仅在图像生成任务中表现突出,在自然语言处理上同样具备了强大的能力。
Janus-Pro基于其DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base两款模型进行了开发,并且采用了SigLIP-L作为视觉编码器,支持高达384x384分辨率的图像输入。这一技术突破,无疑使DeepSeek在AI行业的竞争力进一步增强。
DeepSeek遭遇大规模恶意攻击
所有的事情并非均向好的方向发展。1月28日,DeepSeek在官网发布声明称,其线上服务最近遭遇了大规模的恶意攻击,导致注册通道繁忙,部分新用户注册受限。公司表示,已注册用户可以正常登录,且对外界的理解和支持表示感谢。这一声明虽然简短,却透露出一个不容忽视的信号:DeepSeek的快速崛起和技术突破,似乎已经引起了某些不满势力的关注。
这场恶意攻击是否与DeepSeek的技术突破有关,尚无定论,但其背后所带来的影响不容小觑。网络攻击、数据泄露、虚假信息等问题,可能都将成为DeepSeek在全球市场竞争中必须面对的挑战。
美股市场的反应:科技股全线下跌
DeepSeek的快速崛起和技术突破不仅引发了美国科技公司和媒体的关注,也直接影响了美股市场的表现。1月28日,美股三大指数的表现涨跌不一。道琼斯指数上涨0.65%,但标普500和纳斯达克分别下跌了1.46%和3.07%。尤其是半导体板块的崩盘,成为市场焦点。Nvidia的股价大跌16.86%,创下了历史上最大单日市值蒸发纪录,市值缩水近5888亿美元(约合人民币4.27万亿元)。
这种剧烈波动的背后,很大程度上与DeepSeek的崛起和其低成本、高效能的AI模型直接相关。DeepSeek的技术创新让整个AI行业的竞争格局发生了变化,特别是对传统半导体和硬件厂商的冲击极为明显。DeepSeek以低廉的训练成本和灵活的硬件资源配置,显然让这些传统芯片厂商感到前所未有的压力。
结语:信息战中的技术博弈
DeepSeek的成功无疑为全球AI行业带来了新的思路与突破,但也让我们看到,技术创新背后不仅仅是算法和算力的较量,更是信息战与资源控制的博弈。从关于芯片数量的阴谋论,到网络攻击的频繁发生,再到全球科技股的震荡,这一切都表明,DeepSeek在迅速崛起的同时,已经成为全球科技竞赛中不可忽视的一股力量。
在未来,DeepSeek能否继续保持技术领先,并在全球AI市场中占据一席之地,将不仅仅取决于其算法创新和成本优势,更可能受到政治博弈、国际贸易政策以及信息战的深刻影响。随着AI技术逐渐渗透到各行各业,技术突破背后的争斗或许才刚刚开始。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有