Image

根据公开信息及行业动态,华为昇腾910系列的下一代产品路线图已逐步清晰,主要围绕性能跃升、架构革新、制程升级及生态扩展展开。以下是基于多方信息的综合分析:

一、昇腾910C:过渡性双芯片封装方案

昇腾910C是当前已量产的过渡性产品,采用中芯国际7nm(N+2)工艺,通过双芯片封装技术将两颗昇腾910B整合,实现算力翻倍。其FP16算力约800 TFLOPS,达到英伟达H100的80%左右。该芯片已于2025年一季度大规模出货,主要应用于大模型推理和中小规模训练场景。华为通过CloudMatrix 384超节点系统(集成384颗昇腾910C)在特定工作负载中实现对英伟达GB200 NVL72的超越,但代价是功耗显著增加。

二、昇腾920:2025年下半年量产的主力型号

昇腾920作为昇腾910的直接后继,预计于2025年下半年量产,采用中芯国际6nm工艺,目标性能接近英伟达H100。其核心改进包括:

  1. 架构优化:重新设计内部计算单元,提升算子效率,支持FP8混合精度计算,BF16算力预计达到1500 TFLOPS。
  2. 内存升级:搭载HBM3e高带宽内存,带宽提升至1.2 TB/s,支持万亿参数模型训练。
  3. 互联技术:强化HCCS高速互连接口,支持多芯片集群扩展,降低参数同步时延。
    昇腾920将作为国产替代英伟达H20的主力产品,主要面向互联网、金融、政务等行业的大模型训推需求,预计价格较H100低30%-40%。

三、昇腾910D:2026年对标英伟达H100的高端型号

昇腾910D是华为下一代旗舰芯片,目标直指英伟达H100性能,预计2026年Q2-Q3量产,采用中芯国际5nm工艺(N+3)或等效工艺。关键技术突破包括:

  1. 架构革新:可能转向GPGPU架构,支持更通用的计算任务,同时保留NPU专用加速单元,平衡通用性与能效比。
  2. 封装技术:采用4Die封装设计,集成更多计算核心,FP16算力目标超过2000 TFLOPS,超越H100的1980 TFLOPS。
  3. 能效优化:通过工艺升级和架构调整,将功耗控制在400W以内,能效比优于H100。
    昇腾910D将通过CloudMatrix超节点系统(如配备384颗芯片的集群)在机架级算力上与英伟达Rubin架构GPU竞争,尤其在国产替代场景中占据优势。

四、技术路线的关键挑战与应对

  1. 制程依赖:中芯国际5nm工艺良率目前仅40%-50%,华为需通过先进封装(如Chiplet)和架构优化弥补制程差距。
  2. 生态建设:昇腾正联合伙伴优化CANN算子库和MindSpore框架,支持PyTorch、vLLM等主流框架,降低开发者适配成本。例如,昇腾已实现MoE模型的大规模专家并行推理,吞吐性能提升3.2倍。
  3. 集群扩展:华为通过CloudMatrix架构实现超大规模集群的高效互联,在昇腾910C集群中,梯度同步时延较前代缩短10%-70%。

五、行业影响与市场展望

昇腾下一代产品的推出将加速中国AI算力自主化进程。预计到2026年,昇腾910D+昇腾920的组合将覆盖从推理到训练的全场景需求,在金融风控、生物医药、自然语言处理等领域形成竞争力。尽管单芯片性能仍落后于英伟达最新产品,但华为通过集群技术和生态协同,有望在特定领域实现“以量补质”。例如,昇腾910C集群在DeepSeek-R1模型评估中计算效率超过英伟达H800。

总体而言,华为昇腾的下一代路线图呈现“渐进式升级”与“跨越式突破”并存的特点,通过工艺迭代、架构创新和生态开放,逐步缩小与国际领先水平的差距,并在国产替代市场中占据主导地位。

© 版权所有