华为昇腾910C量产在即,H20禁售令下国产AI芯片加速突围
华为昇腾910C量产在即,H20禁售令下国产AI芯片加速突围
作者:航标
来源:IT精选
4月,美国商务部对华AI芯片出口管制再度升级,英伟达专为中国市场设计的“特供版”H20芯片被列入“无限期许可审批”清单。尽管H20仅为H100算力的20%,但其凭借96GB/141GB高显存容量与成熟的CUDA生态,一直是国内大模型训练的主流选择,部分服务器厂商甚至出现H20库存告急的情况。 此轮禁令直接封锁了中国企业获取国外高性能AI芯片的合法渠道,将带来数百亿美元级算力缺口,意味着国产芯片迎来难得的发展机遇——更大的市场空间与更多的产品落地场景,它们将加速推动国产AI芯片生态的成熟壮大。而近期华为昇腾910C量产在即、昇腾920研发曝光的消息,更预示着国产突围已进入关键决胜阶段。 从昇腾910到920:华为的突围之路 众所周知,为遏制中国人工智能技术发展,美国近年来持续升级对我国高端AI芯片采购及其制造能力的封锁。面对美国的技术围剿,华为、沐曦、摩尔线程、寒武纪、百度等中国企业展开多线突围。 根据IDC 刚发布的2024年中国加速计算芯片的出货报告,英伟达出货量占比70%超过190万片,国产AI芯片头部厂商出货量依次为:华为昇腾64万、百度昆仑芯6.9万、天数3.8万、寒武纪2.6万、沐熙2.4万、燧原1.3万。在国产AI芯片中,华为昇腾一家独大,是国产AI芯片行业的领军企业。 华为的首款AI芯片是2019年推出。这一年华为因被美国制裁,无法采购美国AI芯片,作为“备胎”的昇腾910被迫走向了前台。昇腾910由台积电代工,采用达芬奇架构,7纳米工艺,FP16算力为256 TFLOPS。 2022年左右,昇腾910的国产替代版昇腾910B登场,昇腾910B采用达芬奇2.0架构。此时,国外代工企业已经对中国企业关门,昇腾910B由中芯国际以N+2(等效7nm)工艺制造。910B有B1、B2、B3等多个子型号,其中性能最强昇腾910B的FP16算力达到376 TFLOPS,性能已可对标英伟达A100(312 TFLOPS),但受制程限制,晶体管密度仍落后于台积电同类工艺。 昇腾910C是昇腾系列的最新一代,目前还没有大量上市。昇腾910C仍然由中芯国际代工,采用6nm工艺,集成两颗910B核心,FP16算力跃升至800 TFLOPS,搭载HBM3内存,拥有3.2 TB/s的内存带宽,推理性能达英伟达H100的60%-80%,综合表现全面超越H20。最近有媒体报道昇腾910C将于5月即将量产,相信910C上市不会太久了。 另据报道,华为下一代AI芯片昇腾920也已经进入测试阶段。其采用中芯国际6nm工艺制造,引入了3D立体计算架构、存算一体设计以及多芯片互联架构,峰值算力达到900TFLOPS(BF16),是昇腾芯片又一次突破。 国产AI芯片生态加速补齐 毫无疑问,随着华为昇腾一代代产品的迭代,其性能正在稳步提升。虽然与英伟达的旗舰GPU产品还有一些距离,但已经不是困扰国产芯片的最大障碍。 比如,对于芯片性能上的不足,华为就推出了CloudMatrix 384超节点。CloudMatrix 384超节点通过“堆量+全互连架构”实现了算力突破,其搭载384颗昇腾910C,BF16算力高达300 PFLOPS,内存容量与带宽分别达到英伟达GB200 NVL72的4.6倍和3.1倍。尽管559千瓦功耗要高于GB200 NVL72,但其超大规模模型训练场景下的实战表现,已验证“以规模换性能”战略的可行性。 除了芯片性能方面的差距,制约国内AI芯片普及的还有生态。众所周知,英伟达的成功其CUDA生态发挥了重要的作用。 CUDA生态包括大量算子库、开发框架,还有熟悉CUDA平台开发的开发人员,它们共同构成英伟达的护城河。而中国AI芯片,由于使用的企业少,开发人员也少,周边的开发工具和配套软件自然就少,反过来限制了新用户的加入和新应用场景的落地。 现在,H20禁售令客观上会倒逼更多企业采用华为昇腾,也将带来更多真实场景落地,必将加速华为CANN生态的成长、推动生态的完善。特别是随着字节跳动、腾讯等大企业的加入,将带来大量的人才加盟,人才聚集效应与生态适配速度将呈指数级提升。 另外,DeepSeek的技术突破为国产AI芯片的突围进程注入强心剂——其通过算法优化将训练需求降低80%,直接催生“昇腾+DeepSeek”组合的爆发,催生出一个更大的AI芯片市场。另一方面,国产大模型也可以与AI芯片厂商联手进行产品设计和适配,联合打造出更具性价比的整体解决方案,加速AI芯片的普及。 小结 从“两弹一星”到5G突围,历史反复证明:技术封锁从未击垮中国产业,反而成为自主创新的催化剂。 当前的H20禁令为华为昇腾等国产AI芯片释放出百亿美元级市场空间,将加速昇腾系列规模化落地,帮助中国AI产业形成“应用-迭代-升级”的正向循环:软件生态加速适配(如MindSpore框架)、供应链协同深化(如中芯国际先进封装)、场景优化持续突破(如低精度计算)。 当昇腾910C量产线启动,当CloudMatrix点亮首个国产万卡集群,中国AI产业已站在新起点。这场没有硝烟的战争终将再一次证明:真正的核心技术,从来都是诞生于绝境中的搏杀。 期待国产AI芯片早日突围成功! |