存储涨价之后如何让AI走向数据？

文章聚焦AI时代存储技术的重大变革，强调从被动保存到主动赋能的核心转向。 1.存储架构优化：传统通算架构导致GPU空转浪费，AI原生架构如浪潮信息A9000采用用户态协议栈，实现端到端免拷贝，将延迟降至微秒级，单节点带宽160GB/s远超行业水平。 2.效率提升关键：通过KV Cache技术结合PD分离和GlobalCast，浪潮信息将首Token延迟降低97%，提升Token吞吐量20倍；IBM使用压缩技术（1:5压缩比）在涨价后降低实际单位成本。 3.分层存储体系：五层结构（HBM、DRAM、SSD、外置缓存层、传统存储）新增3.5层，放弃可靠性以保效率，磁带存储作为性价比选择，LTO-10原始容量40TB，压缩后达100TB。 4.让AI走向数据：解决大规模数据一致性难题，IBM内容感知存储和浪潮AI Data Platform实现动态数据管理，避免数据副本问题，释放人力用于创新。 5.成本与机会：存储涨价是暂时的（如DRAM涨90%-95%），优化效率如提升GPU利用率15%更关键，合作模式如浪潮搭台伙伴唱戏、IBM与英伟达合作拓展市场。

国家数据局预测，2024年至2026年3月，中国日均Token调用量将从1000亿飙升至140万亿，两年增长超千倍。这标志着AI已跨越实验室阶段，全面进入生产与业务落地的关键时期。对于电商及高并发行业而言，这一数据暴涨的背后，是存储系统角色的根本性置换：从单纯的“数据保存”容器，进化为主动参与数据处理、支撑AI高效运转的“核心赋能枢纽”。

这场变革并非温和的增量迭代，而是对底层逻辑的全面重构。其核心命题在于，不再是单纯地让数据走向AI，而是如何构建高效的架构让AI走向数据。

算力效能倒逼架构重构

“传统存储侧重于数据保护，而AI存储的首要目标是极致的效率——确保GPU不空转。”浪潮信息存储产品部副总经理郭海峰一语道破了存储使命的质变。这不仅是产品定位的调整，更是技术架构的“基因重组”。

传统企业级存储多采用以CPU为核心的“通算架构”，数据需经CPU路径解析、内核态复制转发后才能传输至GPU。这种机制在服务传统数据库时尚可，但在面对智算时代的GPU集群时，效率瓶颈极为致命。数据显示，在动辄百卡、千卡甚至万卡的GPU集群部署中，投资规模以亿计，“1%的闲置即意味着上亿元的浪费”。鉴于存储和网络成本仅占智算系统的5%-10%，若其导致GPU空转，将直接吞噬其余90%以上的投资回报。

为破解这一困局，存储架构正从软硬件双维度进行“基因重组”。浪潮信息发布的A9000系列产品，采用了“全链路免锁零拷贝的用户态AI原生并行架构”。该架构将数据传输路径从内核态切换至用户态协议栈，实现端到端免拷贝，将延迟从毫秒级降至微秒级，单节点带宽飙升至160GB/s，远超行业主流的60GB/s至80GB/s水平。

在软件层面，KV Cache成为技术演进的主线。在AI推理场景中，为加速响应并避免重复计算，键值对缓存需保留在高速存储中。随着上下文窗口扩大，KV Cache规模已溢出GPU显存（HBM）和本地DRAM的承载上限。通过PD分离（Prefill与Decode分离）、GlobalCast技术及“双路径”设计，A9000利用Agent Memory外置存储架构，将空闲带宽整合，显著缩短首Token产生时间。实测数据显示，该架构可将首Token延迟（TTFT）降低97%，Token吞吐量提升超20倍。

IBM则从硬件维度切入。其Storage Scale并行文件系统专为万卡集群设计，支撑高频checkpoint数据落盘，确保数据极速写入，释放GPU算力。同时，IBM在自研的第五代闪存核心模块（FlashCore Module 5）中，于每块NVMe闪盘嵌入专用芯片与高性能处理器，实现硬件级的压缩、去重和加密。这一设计可实现1:5的压缩比，且因压缩在盘上完成，不占用存储控制器资源。

存储分层与成本博弈

当存储节点进化为承载KV Cache、主动参与计算卸载的智能枢纽，业界对高带宽、低延迟介质的需求呈指数级攀升，这直接引发了上游供应链的产量倾斜与价格波动。数据显示，2026年第一季度DRAM内存合约价涨幅达90%-95%，NAND Flash涨幅达55%-60%，且预计第二季度NAND价格将继续跳升70%至75%。

然而，涨价只是表象，效率优化才是破局关键。有企业通过迁移至高带宽存储方案，GPU利用率提升了15%——仅用项目约10%的资金采购存储，却撬动了整体算力的大幅提升。IBM通过FCM的1:5压缩技术，使得用户在涨价后开启压缩，实际可用容量的单位成本甚至低于涨价前。

更深层的变革在于对“数据应该放在哪里”的重新思考。AI时代的分层逻辑远超传统的“热、温、冷”数据管理，五层存储体系应运而生：第一层HBM，第二层本地DRAM，第三层本地SSD，第四层传统企业级外置存储。而在第三层与第四层之间，新增了专门服务于推理场景的“3.5层”外置缓存层。

“3.5层是为了效率，可牺牲一定可靠性，数据比为1:1，数据丢失可重算，但不能牺牲效率。”这一理念与传统存储“数据保护优先”形成鲜明对比。在经济学约束下，分层是必然选择。

受此影响，“磁带存储”凭借极致性价比重回视野。百度智能云等大厂已部署EB级甚至10EB级磁带库用于冷数据存储。LTO-10已实现40TB原始容量（2.5:1压缩比下可达100TB），未来LTO-11及LTO-12容量将进一步提升。对于数月才访问一次的数据，磁带机械臂约两分钟的抓取时间完全可以接受。

数据范式的根本迁移

存储行业的变革映射出更深层的范式转移：传统的“让数据走向AI”模式已难以为继，“让AI走向数据”成为新共识。在EB级数据、百万并发场景下，应用发起请求、存储响应的传统模式不仅不可持续，更易引发数据一致性的崩塌。

IBM提出的内容感知存储（CAS），结合单一数据副本和即时感知机制，确保数据变化能被模型即时捕获，无需繁琐的副本传输。这使存储从被动仓库转变为主动的数据编排平台。浪潮信息的“AI Data Platform”概念与此异曲同工，强调数据是“不断流淌的河流”，需持续处理、清洗、打标和再优化，而非静态的“湖”。

从产业视角看，这一变革催生了新的协同模式。浪潮信息通过全栈能力“搭台唱戏”，为合作伙伴提供基础设施；IBM则与英伟达深化合作，推出深度集成方案，计划在IBM Cloud上提供英伟达Blackwell Ultra GPU。

技术的最终落点仍是人。76%的CEO对IT架构自信，而43%的CIO感到焦虑，这种认知落差揭示了挑战的复杂性。无论是提升GPU利用率，还是利用AI智能体简化运维，终极目标都是将人从繁琐中解放，聚焦创新。“让存储融入平时的业务中，而不是让业务等存储”，这或许是AI时代对存储行业最朴素的要求。

【价美丽平台】致力于为淘宝、京东、拼多多等商家提供推广服务，助力店铺实现快速起店、精准测品，高效解决店铺运营难题，加速店铺成长，轻松打开市场！

存储涨价之后 如何让AI走向数据？

算力效能倒逼架构重构

存储分层与成本博弈

数据范式的根本迁移

存储涨价之后如何让AI走向数据？