在2025年度的华为云生态大会上,华为云计算迎来了一个重要的里程碑。华为常务董事兼云计算业务CEO张平安向与会者揭示了AI基础设施的最新进展,隆重推出了CloudMatrix 384超节点,并宣布该技术在芜湖数据中心已成功实现规模化部署。
CloudMatrix 384超节点的推出,标志着华为云在资源供给模式上的重大革新。这一创新技术实现了从服务器级向矩阵级的飞跃,以“高密”“高速”“高效”为核心优势,通过前沿的架构设计,在算力、互联带宽以及内存带宽等多个维度上取得了领先优势。
华为云持续优化昇腾AI云服务,目前该服务已全面适配超过160个第三方大模型,其中包括DeepSeek,为大型模型的训练和推理提供了强有力的支持,助力行业应用迅速落地。华为云盘古大模型的应用场景也在不断拓展,现已覆盖30多个行业、400多个具体场景,广泛应用于城市治理、智慧金融、医疗健康、气象预测等领域。
与此同时,硅基流动公司与华为云携手,基于CloudMatrix 384超节点昇腾云服务和高性能推理框架SiliconLLM,正式上线了DeepSeek-R1服务。据硅基流动介绍,该服务在保持单用户20 TPS水平的同时,单卡Decode吞吐达到了1920 Tokens/s,性能表现媲美H100部署。经过主流测试集的验证以及大规模线上盲测,昇腾算力部署下的DeepSeek-R1模型精度与官方版本保持一致。