这场变革并非温和的增量迭代,而是对底层逻辑的全面重构。其核心命题在于,不再是单纯地让数据走向AI,而是如何构建高效的架构让AI走向数据。
算力效能倒逼架构重构
“传统存储侧重于数据保护,而AI存储的首要目标是极致的效率——确保GPU不空转。”浪潮信息存储产品部副总经理郭海峰一语道破了存储使命的质变。这不仅是产品定位的调整,更是技术架构的“基因重组”。
传统企业级存储多采用以CPU为核心的“通算架构”,数据需经CPU路径解析、内核态复制转发后才能传输至GPU。这种机制在服务传统数据库时尚可,但在面对智算时代的GPU集群时,效率瓶颈极为致命。数据显示,在动辄百卡、千卡甚至万卡的GPU集群部署中,投资规模以亿计,“1%的闲置即意味着上亿元的浪费”。鉴于存储和网络成本仅占智算系统的5%-10%,若其导致GPU空转,将直接吞噬其余90%以上的投资回报。
为破解这一困局,存储架构正从软硬件双维度进行“基因重组”。浪潮信息发布的A9000系列产品,采用了“全链路免锁零拷贝的用户态AI原生并行架构”。该架构将数据传输路径从内核态切换至用户态协议栈,实现端到端免拷贝,将延迟从毫秒级降至微秒级,单节点带宽飙升至160GB/s,远超行业主流的60GB/s至80GB/s水平。
在软件层面,KV Cache成为技术演进的主线。在AI推理场景中,为加速响应并避免重复计算,键值对缓存需保留在高速存储中。随着上下文窗口扩大,KV Cache规模已溢出GPU显存(HBM)和本地DRAM的承载上限。通过PD分离(Prefill与Decode分离)、GlobalCast技术及“双路径”设计,A9000利用Agent Memory外置存储架构,将空闲带宽整合,显著缩短首Token产生时间。实测数据显示,该架构可将首Token延迟(TTFT)降低97%,Token吞吐量提升超20倍。
IBM则从硬件维度切入。其Storage Scale并行文件系统专为万卡集群设计,支撑高频checkpoint数据落盘,确保数据极速写入,释放GPU算力。同时,IBM在自研的第五代闪存核心模块(FlashCore Module 5)中,于每块NVMe闪盘嵌入专用芯片与高性能处理器,实现硬件级的压缩、去重和加密。这一设计可实现1:5的压缩比,且因压缩在盘上完成,不占用存储控制器资源。
存储分层与成本博弈
当存储节点进化为承载KV Cache、主动参与计算卸载的智能枢纽,业界对高带宽、低延迟介质的需求呈指数级攀升,这直接引发了上游供应链的产量倾斜与价格波动。数据显示,2026年第一季度DRAM内存合约价涨幅达90%-95%,NAND Flash涨幅达55%-60%,且预计第二季度NAND价格将继续跳升70%至75%。
然而,涨价只是表象,效率优化才是破局关键。有企业通过迁移至高带宽存储方案,GPU利用率提升了15%——仅用项目约10%的资金采购存储,却撬动了整体算力的大幅提升。IBM通过FCM的1:5压缩技术,使得用户在涨价后开启压缩,实际可用容量的单位成本甚至低于涨价前。
更深层的变革在于对“数据应该放在哪里”的重新思考。AI时代的分层逻辑远超传统的“热、温、冷”数据管理,五层存储体系应运而生:第一层HBM,第二层本地DRAM,第三层本地SSD,第四层传统企业级外置存储。而在第三层与第四层之间,新增了专门服务于推理场景的“3.5层”外置缓存层。
“3.5层是为了效率,可牺牲一定可靠性,数据比为1:1,数据丢失可重算,但不能牺牲效率。”这一理念与传统存储“数据保护优先”形成鲜明对比。在经济学约束下,分层是必然选择。
受此影响,“磁带存储”凭借极致性价比重回视野。百度智能云等大厂已部署EB级甚至10EB级磁带库用于冷数据存储。LTO-10已实现40TB原始容量(2.5:1压缩比下可达100TB),未来LTO-11及LTO-12容量将进一步提升。对于数月才访问一次的数据,磁带机械臂约两分钟的抓取时间完全可以接受。
数据范式的根本迁移
存储行业的变革映射出更深层的范式转移:传统的“让数据走向AI”模式已难以为继,“让AI走向数据”成为新共识。在EB级数据、百万并发场景下,应用发起请求、存储响应的传统模式不仅不可持续,更易引发数据一致性的崩塌。
IBM提出的内容感知存储(CAS),结合单一数据副本和即时感知机制,确保数据变化能被模型即时捕获,无需繁琐的副本传输。这使存储从被动仓库转变为主动的数据编排平台。浪潮信息的“AI Data Platform”概念与此异曲同工,强调数据是“不断流淌的河流”,需持续处理、清洗、打标和再优化,而非静态的“湖”。
从产业视角看,这一变革催生了新的协同模式。浪潮信息通过全栈能力“搭台唱戏”,为合作伙伴提供基础设施;IBM则与英伟达深化合作,推出深度集成方案,计划在IBM Cloud上提供英伟达Blackwell Ultra GPU。
技术的最终落点仍是人。76%的CEO对IT架构自信,而43%的CIO感到焦虑,这种认知落差揭示了挑战的复杂性。无论是提升GPU利用率,还是利用AI智能体简化运维,终极目标都是将人从繁琐中解放,聚焦创新。“让存储融入平时的业务中,而不是让业务等存储”,这或许是AI时代对存储行业最朴素的要求。