热设计网

华为“算力核弹”正式亮相!领先英伟达一代,黄仁勋:确实被超越了

热设计

来源:网络

近日,2025世界人工智能大会(WAIC)在上海世博中心盛大举行。

在此次大会上,华为首次线下展出了昇腾384超节点,其正式名称为Atlas 900 A3 SuperPoD。

image.png

这款产品基于超节点架构打造,通过总线技术达成了384个NPU之间的大带宽低时延互联,有效解决了集群内计算、存储等各资源之间的通信瓶颈问题。

同时,借助系统工程的优化,实现了资源的高效调度,让超节点能够像一台计算机一样稳定工作。

其实,在今年5月的鲲鹏昇腾开发者大会上,华为就已推出了昇腾超节点,成功实现了业界最大规模的384卡高速总线互联。

昇腾超节点具备超大带宽、超低时延、超强性能三大显著优势,涵盖多款训练和推理产品。

基于超节点创新架构,它能更好地满足模型训练和推理对低时延、大带宽、长稳可靠的严苛要求。

据官方公告,华为的AI算力集群解决方案CloudMatrix 384,以384颗昇腾芯片为基础构建,通过全互连拓扑架构实现芯片间的高效协同。

该方案可提供高达300 PFLOPs的密集BF16算力,性能接近英伟达GB200 NVL72系统的两倍。

此外,CM384在内存容量和带宽方面同样优势明显,其总内存容量超出英伟达方案3.6倍,内存带宽达到英伟达方案的2.1倍,为大规模AI训练和推理提供了更为高效的硬件支持。

尽管单颗昇腾芯片的性能约为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计,成功实现了整体算力的显著跃升,并在超大规模模型训练、实时推理等场景中展现出更强的竞争力。

按照国外投行的观点,华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”,并且认为中国在AI基础设施上取得的突破,将对全球AI产业格局产生深远影响。

对于这个方案,黄仁勋曾公开表示,英伟达确实被华为超越。

“从技术参数看,华为的CloudMatrix 384超节点,性能上甚至超越了英伟达,比英伟达的尖端技术更具优势,因此我们必须高度重视这家实力雄厚的公司,全力以赴应对挑战。华为已明确表态要融合5G与AI技术,这种布局极具前瞻性,是完全正确的战略方向。我们也在推进同样的计划,但必须加快步伐。”

黄仁勋还指出,即使英伟达缺席,中国本土的创新者、芯片公司以及像华为这样的企业,也能满足市场需求。许多云服务提供商也将自主研发芯片来支撑业务发展。“所以我认为中国AI市场,无论有没有英伟达都会进步,”他明确表示,“如果我们不在这里,华为也一定能找到自己的解决方案。这是我对人类创新能力的信心,有志者事竟成。

他特别盛赞华为的技术实力,称其为一家“实力强劲的公司”。黄仁勋举例道:“若仔细观察华为手机,就能理解其中蕴含的技术奇迹。”他进一步评价道:“如果你看现在的华为,他们在自动驾驶领域非常出色,AI技术也相当卓越。这是一家拥有强大芯片设计能力、系统设计和系统软件的公司。”

此前,当被问及华为AI芯片在训练领域能否取代英伟达时,黄仁勋就曾表示“这只是时间问题”,并高度评价华为拥有顶尖的芯片设计能力。

他特别指出华为在系统工程、网络工程等多个技术领域表现出色,且凭借自有云服务实现了市场独立开拓,展现出强大的综合竞争力。

黄仁勋坦言将尽全力向华为及越来越多的竞争对手学习。他警告称,任何轻视华为和中国制造能力的人都“极其天真”。

网站末尾图片.png

标签: 点击: 评论:

留言与评论(共有 0 条评论)
   
验证码: