过去两年,在生成式AI搭建的舞台上,算力无疑是最耀眼的明星。日益强大的AI算力也逐步打破通用算力一统江湖的局面,成为人工智能时代更具影响力的支配力量。
当算力基础设施的建设热潮回归理性,普惠大模型引领的AI应用落地渐成主旋律,与数据关系紧密的存储开始从舞台的边缘向中央迈进。“数据决定人工智能的高度”成了新的魔法棒,驱动千行百业追求更大规模、更高质量的数据,这对存储的性能、扩展性、数据范式及韧性都提出前所未有的要求。
与过往的通用存储相比,AI时代的存储在角色定位与价值赋能等方面均发生重大变化。当下,存储已演变为大模型数据收集、预处理、训练、推理的关键一环,决定了能保存利用的数据容量、训练及推理的数据存取效率、基础设施可用度以及数据安全,堪称人工智能宏大叙事中不可或缺的主角。
显而易见,AI存储“独立门户”的契机业已成熟,围绕新兴领域进行政策支持、资源投入和市场布局更是当务之急。然而,由于新型AI存储属于刚刚兴起的赛道,其外延和内涵尚存在模糊地带,亟需厘清概念定义及核心特征,并借助关键技术与实践案例的结合指引发展方向,为带动新一轮增长创造必要条件。
正是在这样的背景下,中国信通院人工智能研究所近日编制的《新型人工智能存储研究报告(2025年)》引起广泛关注,其对新型AI存储的概念范围、面临挑战、关键技术、最佳实践做出梳理和分析,并提出未来我国新型AI存储的发展建议,为这条前景广阔的超级赛道勾勒出清晰的进化蓝图。
名正则言顺:新型AI存储开疆扩土正当时
在相当长一段时间里,“算力优先”是很多行业客户开展信息化建设、推进数字化转型的默认原则,这既造成了各种“烟囱式”算力基础设施各自为战的弊端,也必然衍生出“数据跟着算力瞎跑”的后果。
以大模型为核心驱动力的生成式AI改变了既有的游戏规则,“算力围着数据转”的新模式渐趋成型。方兴未艾的智算中心即是典型例证:其以数据为中心,多种异构算力紧密围绕统一的数据底座,作为数据载体的存储也因此成为AI基础设施的“主心骨”。
正所谓“名正则言顺”,主角登场需要更明晰的身份界定。《新型人工智能存储研究报告(2025年)》中指出:“新型AI存储是指专为人工智能应用和服务设计的数据存储系统,具备超高性能、超大容量、极致安全、数据编织等特征,可以有效支撑海量数据的分析和学习,是AI基础架构不可或缺的组成部分。”
从某种意义上讲,这个定义恰如其分地反映了存储在AI新时代的价值跃迁。事实上,新型AI存储与大模型数据归集、预处理、训练、推理等全生命周期流程密切相关,特别是在不同行业和组织内部具备形成多元化数据集的条件下,新型AI存储正在成为数据资源的统一管理平台,为全方位的数据赋能提供鼎力支撑。
作为开疆扩土的“六边形战士”,新型AI存储直面诸多挑战,具备极致性能、数据安全、大模型数据范式、高扩展性、数据编织和绿色节能等关键特征。其中,极致的性能密度可加速数据供给,缩短训练数据的归集与预处理;支持向量、张量、KV Cache等大模型数据范式,能显著改善数据的融合检索;高可靠性增加AI基础设施的持续服务时间,防勒索和存储加密进一步保障数据安全;跨域跨集群的AI数据湖支撑异构计算、近存计算的扩展;数据编织提供全局数据可视、可管,并确保数据质量不被破坏;绿色的AI存储可降低每TB数据的能耗和占用空间。
推动系统化技术创新:AI存储探索最佳进化路径
任何新生“物种”的发展都不可能一帆风顺,需要完成从技术创新到应用落地的“惊险一跃”。以近年来AI服务器的蜕变为例:早期只是GPU的独角戏,后来变成整个系统创新的交响曲,最终闯出一片超越传统通用服务器的新天地。
透过AI算力“另起炉灶”的演变轨迹,可以预见新型AI存储未来的进化路径——从存储介质、系统、架构、数据编织、数据范式和数据安全等多维度发力,协同提升大模型数据存储能力,为行业客户的业务创新保驾护航。
针对AI大模型落地进程的突出痛点,长记忆存储范式为推理提质增效。长记忆存储通过多级KV Cache机制,降低大模型推理的内存占用和计算开销,并以分级方式实现“终身记忆”能力,支持长序列推理和动态上下文建模。在医疗领域,长记忆存储可缓存病理图像的历史结果,减少大部分冗余计算,提升推理速度数倍,同时支持多模态数据协同,增强模型对复杂场景的适应性。
为了打破林林总总的“数据孤岛”,数据编织加强全局数据高效处理。数据编织通过构建统一数据视图,实现跨域数据整合与高效流动。数据版本管理、数据血缘管理和统一命名空间等技术,能确保数据质量不下降,并通过兼容多种存储协议达成AI全流程业务的无缝对接。在AI企业的实践中,全局文件系统支持数据零拷贝和端到端加速,跨域调度效率明显提升,大幅降低数据治理成本,满足大模型对场景化数据治理的需求。
从传统的主从服务器架构向全对等、全直通架构转变是大势所趋,超节点存储架构持续支撑扩展法则。超节点存储架构可通过高通量数据总线互联,统一内存语义访问数据,实现计算、存储资源解耦灵活调度,资源利用率最大化;借助近存计算将数据预处理功能下沉至存储层,减少数据搬运开销,支撑十万卡级算力集群扩展,满足大模型对高扩展性和高并行数据流转的需求。
提高数据存取效率、实现数据直达是客户梦寐以求的目标,高性能并行文件系统能真正做到以存强算。基于高性能、高可靠、高扩展和加速卡直通存储技术特性,高性能并行文件系统能显著提升大模型训练推理效率:百TB/s级带宽和亿级IOPS能力支持超万卡集群无瓶颈扩展;EB级扩展能力适应海量数据;存储系统高可用性达到六个9,实现软硬件故障自动切换;加速卡直通技术使数据从存储到算力“一跳直达”。
此外,全闪存存储技术可为数据提速降耗,存储内生安全技术则是构建大模型系统数据安全防护的最后一道防线,它们与前面提及的各项技术创新相辅相成,为新型AI存储的不断进化扫清了障碍。
从落地生根到持续成长:AI存储打造超级赛道
令人欣喜的是,新型AI存储不仅完成了从基本概念到方法论体系的构建,而且已在医疗、金融、运营商、制造等行业实现落地,成为智能辅助诊断、智慧金融、智算中心云底座重构、智能客服创新等AI应用场景的“弄潮儿”。
不难看出,未来5~10年,新型AI存储有机会成长为一个超级赛道,其对整个人工智能产业链的长远发展必将产生深刻影响。考虑到外部环境还存在诸多不确定性因素,打造具备全球竞争力的新型AI存储发展体系迫在眉睫。
加强顶层设计、统筹部署是首要任务。在国家战略层面应尽快形成AI存储产业发展的整体规划,系统布局AI存储设施,制定引导产业高速健康发展的政策措施;同时,推进建立计算与存储并重的大模型基础设施,形成一批新型应用场景和示范项目。
增强AI存储自主创新能力需多管齐下。在国家科技攻关计划和相关产业链中可设立AI存储专项,充分发挥行业创新领军企业的带动作用;组织国内产学研用各界联合攻关,促进全产业链自主创新等。
推动AI存储产业协同发展任重而道远。在产业发展层面,鼓励国产设备应用,提升AI存储的安全保障能力;加强国产化应用牵引,推动自主品牌做大做强;打通AI存储上下游产业链,形成协同创新的新格局。
站在更开阔的视角,新型AI存储很可能是开辟人工智能“另一条道路”的重要支点,以存强算、以模助算亦是“弯道超车”的核心抓手。对中国AI存储界而言,时不我待,只争朝夕。


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有