
4月24日,2026海光基础软件生态高峰论坛在郑州落下帷幕。这场以“AI时代下的软硬融合新机遇”为主题的会议,聚集了云计算、数据库、操作系统、AI大模型等领域的多家企业。两天下来,一个在现场被反复提及的“暴论”式判断,值得拿出来单独讨论。
“AI基础设施的竞争,已经不在卡,在系统。”
这句话出自科技媒体从现场发回的观察,但整场论坛的讨论主线,几乎都在反复印证这个判断。过去两年,行业习惯用单卡算力、显存带宽、跑分排名来衡量一家芯片公司的实力;但今年郑州会场上的议题明显转向了另一套话语:超节点如何互联?异构资源怎么调度?软件栈能不能把算力喂饱?

一个容易被忽略的细节:就在论坛前几天,DeepSeek-V4开源发布。当天,海光DCU完成了对该模型的Day 0适配。不是发布后才开始赶工适配,而是提前预判技术路线、与模型团队早期协同开发,在开源当日就能提供可用环境。这种“预适配机制”的出现,至少说明两件事:一是技术预判能力开始形成,二是海光在AI产业链中的位置已经不再是单纯的“芯片供应商”,而是被主流模型厂商纳入早期对齐名单。
海光生态系统发展部总经理郑臣明在论坛上提到过一个数字:光合组织已汇聚6000多家合作伙伴,在全国建成34个实体生态适配中心,累计完成15000多项软硬件适配测试。此外,为帮助让伙伴真正跑起来、产生合力,海光同步公布了三大生态行动计划——卓越、共赢、远播,分别从研发、销售、市场三个维度,试图把生态从“签个协议”推向实质性协同。
再往前翻一下时间线。4月2日,这家公司发布了DCU软件栈年度版本和“内生安全”技术。论坛上又披露了两组数据:其DCU算力集群已能稳定支撑万亿到十万亿参数的大模型训练;在MLPerf国际测试中取得“优异”成绩。需要客观看待的是,这类表述在过去常被质疑为“自说自话”,但放在2026年的语境下,公司已有2025年营收破百亿、365款主流大模型适配验证的实绩作为支撑,含金量确实不同于一两年前。
如果把这些变化放到更大的行业背景中看,一个共识正在形成:单点算力再强,如果全栈链路中存在短板——互联带宽不足、调度效率低下、算子库缺失——最终有效算力仍然上不去。从“单卡适配”到“全栈协同”,竞争颗粒度的变化反映了行业认知的迭代。
近期有行业分析指出,当前全球AI发展被NVIDIA的GPGPU架构和CUDA生态深度绑定,形成了“模型-架构-生态”三重依赖。而国产软硬件的优化突破,以及国产芯片的适配表现,正意味着国产阵营尝试打破CUDA护城河的可能——不再只是被动兼容,而是试图建立自己的协同设计节奏。
不可否认的,核心算子和工程优化的绝对优势仍在英伟达生态内。但趋势的方向已经比较清楚了——既然有玩家在尝试打破这套垄断格局,整个市场的技术栈选择空间就会逐渐扩大。
AI算力的竞争,已经实质性地从硬件参数的较量,转向了系统整合能力的比拼。下半年各家在产品层面的具体动作,值得持续追踪。
4001102288 欢迎批评指正
All Rights Reserved 新浪公司 版权所有