品玩4月15日讯,据科创板日报报道,华为公布了 AI 基础设施架构的新进展,推出 CloudMatrix 384 超节点,并已上线。
据悉,华为 CloudMatrix 384 在规模、性能和可靠性上对标英伟达 NVL72:
- 基于 CloudMatrix 的昇腾 AI 云服务,大模型训练作业可稳定运行40天,互联带宽断点恢复在 10 秒级别。
- 在互联带宽上,超节点网络交换机采用 6812 个 400G 光模块,实现 2.8Tbps 卡间互联带宽。
- 报道援引硅基流动消息,硅基流动已经联合华为云基于 CloudMatrix 384 超节点昇腾云服务正式上线 DeepSeek-R1,在保证单用户 20TPS 水平前提下,单卡 Decode 吞吐突破 1920Tokens/s,可比肩 H100 部署性能。
- 目前,国产芯片与英伟达芯片在单卡性能方面仍存在一定的差距,但通过多卡集群后差距就会缩小。华为公布的数据显示,CloudMatrix 384 实现算力规模达 300PFlops,相比英伟达 NVL72 的 180PFlops 提升 67%。
