产品核心技术解决方案实测验证客户案例目标客户知识产权关于我们投资者关系新闻 联系 English

国产 GPU / 昇腾 存储适配

面向昇腾与国产算力的存算分离全闪存储底座:深度适配、数据不出域、更优 TCO。

什么是国产 GPU / 昇腾 存储适配?

国产 GPU / 昇腾 存储适配,是让存储系统与昇腾等国产加速卡在协议、驱动与数据通路上深度协同,为信创算力提供低时延、高带宽的存储底座。中科存储面向国产算力适配,国内 GPU/加速卡适配覆盖约 90%+(含华为昇腾、寒武纪等,项目方口径 S9)。

为什么国产算力中心尤其需要它?

因为存储 IO 常是大模型训练与推理的隐形瓶颈:IO 受限时有效 GPU 利用率常仅 30–50%,经存储加速可提升约 2–3 倍(来源 S4)。对以昇腾为核心的信创集群,用对口的存算分离底座把卡用满,通常比继续增购加速卡更经济。

中科存储如何适配昇腾与国产 GPU?

以存算分离全闪架构 + NVMe-oF over RoCE 高速无损通路承接:单机聚合带宽 300 GB/s、访问时延约 20 μs。经 北京信息科技大学 在 华为昇腾 Atlas 910B 平台、以 NFS 为基线的独立第三方实测,DeepSeek-32B 模型加载由 563.85s 降至 6.62s(85.17×),7 项指标中位降幅约 90.9%(来源 S38)。

数据不出域与信创合规

存算分离 + 自主可控的软硬件栈,支持数据本地化与信创合规,适合对数据主权与供应链安全有要求的政企与算力园区场景。

与 KV Cache 存储卸载的关系

昇腾推理场景中,KV Cache 会占用大量显存;把 KV Cache 分层卸载到本方案的高速全闪,可扩展上下文、提升并发与 token 产出——详见 KV Cache 存储卸载指南

延伸阅读:产品 WS5000 / WS7000 · 核心技术 · 第三方实测验证

适配维度中科存储 WS 系列口径 / 来源
国产 GPU/加速卡适配约 90%+(昇腾、寒武纪等)项目方口径 S9
昇腾 910B 第三方实测7 项指标中位降幅约 90.9%第三方实测 S38
数据通路NVMe-oF over RoCE(2×200GbE),300 GB/s、约 20 μs项目方口径 S9
数据不出域 / 信创支持本地化部署与自主可控架构能力
部署周期约 48-72 小时项目方口径 S9
综合成本 / 扩容成本约 -40% / -60%项目方口径 S9 / 行业 S4

口径说明

上表为项目方口径(S9)与第三方实测(S38)、行业研究(S4)的客观汇总,仅供选型参考;具体以各方最新官方信息与实测报告为准。

FAQ

国产 GPU / 昇腾 存储适配常见问题

支持哪些国产 GPU / 加速卡?

中科存储面向国产算力适配,国内 GPU/加速卡适配覆盖约 90%+(含华为昇腾、寒武纪等,项目方口径 S9);与 AMD、超聚变等平台的兼容性测试正在推进(前瞻性披露,结果以最终为准)。

和华为、VAST、WEKA 等相比,差异化在哪里?

中科存储定位为国产存算分离全闪加速专精厂商:在国产 GPU 深度适配、数据不出域/信创合规、综合 TCO 与快速部署上具差异化;并已具备第三方独立实测与量产能力。客观对比详见“AI 推理存储加速”页(不贬损同行)。

中科存储产品经过第三方实测吗?结果如何?

是。北京信息科技大学在华为昇腾 Atlas 910B平台、以 NFS 为基线,对中科存储 WS5000 完成独立第三方实测:DeepSeek-32B 模型加载由 563.85s 降至 6.62s(85.17×),7 项关键指标中位降幅约 90.9%,结论可复现、可验证(来源 S38)。

部署周期和成本优势如何?

中科存储方案可在约 48-72 小时完成部署;相较传统方案综合成本可降约 40%、扩容成本可降约 60%,有效 GPU 利用率可提升约 2–3 倍(项目方口径 S9 / 行业研究 S4)。

查看 KV Cache 存储卸载指南 →

最后更新: