存储涨价之后 如何让AI走向数据?

文章聚焦AI时代存储技术的重大变革,强调从被动保存到主动赋能的核心转向。 1.存储架构优化:传统通算架构导致GPU空转浪费,AI原生架构如浪潮信息A9000采用用户态协议栈,实现端到端免拷贝,将延迟降至微秒级,单节点带宽160GB/s远超行业水平。 2.效率提升关键:通过KV Cache技术结合PD分离和GlobalCast,浪潮信息将首Token延迟降低97%,提升Token吞吐量20倍;IBM使用压缩技术(1:5压缩比)在涨价后降低实际单位成本。 3.分层存储体系:五层结构(HBM、DRAM、SSD、外置缓存层、传统存储)新增3.5层,放弃可靠性以保效率,磁带存储作为性价比选择,LTO-10原始容量40TB,压缩后达100TB。 4.让AI走向数据:解决大规模数据一致性难题,IBM内容感知存储和浪潮AI Data Platform实现动态数据管理,避免数据副本问题,释放人力用于创新。 5.成本与机会:存储涨价是暂时的(如DRAM涨90%-95%),优化效率如提升GPU利用率15%更关键,合作模式如浪潮搭台伙伴唱戏、IBM与英伟达合作拓展市场。
国家数据局预测,2024年至2026年3月,中国日均Token调用量将从1000亿飙升至140万亿,两年增长超千倍。这标志着AI已跨越实验室阶段,全面进入生产与业务落地的关键时期。对于电商及高并发行业而言,这一数据暴涨的背后,是存储系统角色的根本性置换:从单纯的“数据保存”容器,进化为主动参与数据处理、支撑AI高效运转的“核心赋能枢纽”。

这场变革并非温和的增量迭代,而是对底层逻辑的全面重构。其核心命题在于,不再是单纯地让数据走向AI,而是如何构建高效的架构让AI走向数据。

算力效能倒逼架构重构



“传统存储侧重于数据保护,而AI存储的首要目标是极致的效率——确保GPU不空转。”浪潮信息存储产品部副总经理郭海峰一语道破了存储使命的质变。这不仅是产品定位的调整,更是技术架构的“基因重组”。

传统企业级存储多采用以CPU为核心的“通算架构”,数据需经CPU路径解析、内核态复制转发后才能传输至GPU。这种机制在服务传统数据库时尚可,但在面对智算时代的GPU集群时,效率瓶颈极为致命。数据显示,在动辄百卡、千卡甚至万卡的GPU集群部署中,投资规模以亿计,“1%的闲置即意味着上亿元的浪费”。鉴于存储和网络成本仅占智算系统的5%-10%,若其导致GPU空转,将直接吞噬其余90%以上的投资回报。

为破解这一困局,存储架构正从软硬件双维度进行“基因重组”。浪潮信息发布的A9000系列产品,采用了“全链路免锁零拷贝的用户态AI原生并行架构”。该架构将数据传输路径从内核态切换至用户态协议栈,实现端到端免拷贝,将延迟从毫秒级降至微秒级,单节点带宽飙升至160GB/s,远超行业主流的60GB/s至80GB/s水平。

在软件层面,KV Cache成为技术演进的主线。在AI推理场景中,为加速响应并避免重复计算,键值对缓存需保留在高速存储中。随着上下文窗口扩大,KV Cache规模已溢出GPU显存(HBM)和本地DRAM的承载上限。通过PD分离(Prefill与Decode分离)、GlobalCast技术及“双路径”设计,A9000利用Agent Memory外置存储架构,将空闲带宽整合,显著缩短首Token产生时间。实测数据显示,该架构可将首Token延迟(TTFT)降低97%,Token吞吐量提升超20倍。

IBM则从硬件维度切入。其Storage Scale并行文件系统专为万卡集群设计,支撑高频checkpoint数据落盘,确保数据极速写入,释放GPU算力。同时,IBM在自研的第五代闪存核心模块(FlashCore Module 5)中,于每块NVMe闪盘嵌入专用芯片与高性能处理器,实现硬件级的压缩、去重和加密。这一设计可实现1:5的压缩比,且因压缩在盘上完成,不占用存储控制器资源。

存储分层与成本博弈



当存储节点进化为承载KV Cache、主动参与计算卸载的智能枢纽,业界对高带宽、低延迟介质的需求呈指数级攀升,这直接引发了上游供应链的产量倾斜与价格波动。数据显示,2026年第一季度DRAM内存合约价涨幅达90%-95%,NAND Flash涨幅达55%-60%,且预计第二季度NAND价格将继续跳升70%至75%。

然而,涨价只是表象,效率优化才是破局关键。有企业通过迁移至高带宽存储方案,GPU利用率提升了15%——仅用项目约10%的资金采购存储,却撬动了整体算力的大幅提升。IBM通过FCM的1:5压缩技术,使得用户在涨价后开启压缩,实际可用容量的单位成本甚至低于涨价前。

更深层的变革在于对“数据应该放在哪里”的重新思考。AI时代的分层逻辑远超传统的“热、温、冷”数据管理,五层存储体系应运而生:第一层HBM,第二层本地DRAM,第三层本地SSD,第四层传统企业级外置存储。而在第三层与第四层之间,新增了专门服务于推理场景的“3.5层”外置缓存层。

“3.5层是为了效率,可牺牲一定可靠性,数据比为1:1,数据丢失可重算,但不能牺牲效率。”这一理念与传统存储“数据保护优先”形成鲜明对比。在经济学约束下,分层是必然选择。

受此影响,“磁带存储”凭借极致性价比重回视野。百度智能云等大厂已部署EB级甚至10EB级磁带库用于冷数据存储。LTO-10已实现40TB原始容量(2.5:1压缩比下可达100TB),未来LTO-11及LTO-12容量将进一步提升。对于数月才访问一次的数据,磁带机械臂约两分钟的抓取时间完全可以接受。

数据范式的根本迁移



存储行业的变革映射出更深层的范式转移:传统的“让数据走向AI”模式已难以为继,“让AI走向数据”成为新共识。在EB级数据、百万并发场景下,应用发起请求、存储响应的传统模式不仅不可持续,更易引发数据一致性的崩塌。

IBM提出的内容感知存储(CAS),结合单一数据副本和即时感知机制,确保数据变化能被模型即时捕获,无需繁琐的副本传输。这使存储从被动仓库转变为主动的数据编排平台。浪潮信息的“AI Data Platform”概念与此异曲同工,强调数据是“不断流淌的河流”,需持续处理、清洗、打标和再优化,而非静态的“湖”。

从产业视角看,这一变革催生了新的协同模式。浪潮信息通过全栈能力“搭台唱戏”,为合作伙伴提供基础设施;IBM则与英伟达深化合作,推出深度集成方案,计划在IBM Cloud上提供英伟达Blackwell Ultra GPU。

技术的最终落点仍是人。76%的CEO对IT架构自信,而43%的CIO感到焦虑,这种认知落差揭示了挑战的复杂性。无论是提升GPU利用率,还是利用AI智能体简化运维,终极目标都是将人从繁琐中解放,聚焦创新。“让存储融入平时的业务中,而不是让业务等存储”,这或许是AI时代对存储行业最朴素的要求。

【价美丽平台】致力于为淘宝、京东、拼多多等商家提供推广服务,助力店铺实现快速起店、精准测品,高效解决店铺运营难题,加速店铺成长,轻松打开市场!