人工智能月度跟踪:GTC25,NVIDIA发布Vera Rubin Superchip

股票资讯 阅读:1 2025-11-25 13:16:51 评论:0

  投资要点:

  事件:2025年10月29日,NVIDIACEO黄仁勋在美国华盛顿举行的GTC大会上发表主题演讲,不仅展示了下一代超级芯片VeraRubin的原型机,更提出了“AI不是工具,而是会用工具的工人”这一颠覆性观点。

  作为全球知名芯片设计公司,NVIDIA长期专注高性能GPU及系统芯片研发。在架构早期阶段,其通过2010年前的Tesla、2010年的Fermi、2012年的Kepler及2014年的Maxwell四大系列,推动GPU从“图形加速专用硬件”成功转型为“通用并行计算引擎”,期间持续优化可靠性、能效比与场景适配能力;2016年后,伴随AI与高性能计算需求爆发,NVIDIA加快迭代节奏,先后推出2016年的Volta(首推TensorCore开启AI算力硬件加速)、2022年的Hopper(以TransformerEngine支撑大模型研发)、2024年的Blackwell(全栈协同设计提升AI推理与图形渲染性能)等架构,并计划通过下一代Rubin、Feynman架构突破算力密度与能效比极限,服务超复杂场景。

  为突破摩尔定律逼近物理极限、晶体管密度对算力边际贡献下降的瓶颈,NVIDIA于2025年10月29日推出VeraRubin超级芯片。该超级芯片并未单纯堆积晶体管,而是通过CPU与GPU的异构协同、HBM4高带宽显存的搭配,以及CUDA生态的兼容,以架构与系统级创新实现算力跃升。1)从硬件配置来看,VeraRubin超级芯片由RubinGPU与VeraCPU构成。RubinGPU被大量电源电路环绕,配备8个HBM4显存位点,且集成两颗Reticle尺寸GPU芯片;VeraCPU则搭载88个定制ARM核心,总计提供176个线程。2)从性能迭代来看,NVIDIA芯片从Hopper、Blackwell演进至Rubin架构。VeraRubin超级芯片作为该代旗舰,其VR200、VR300(Ultra)加速器的FP4算力分别达50、100PFLOPS,搭配288GBHBM4乃至1025GBHBM4E显存,带宽最高32TB/s,较前代Blackwell架构实现数倍提升;同时CPU从Grace系列升级为Vera系列,核心性能与线程数的提升进一步释放了异构协同的算力。

  伴随VeraRubin超级芯片的持续推进,NVIDIA计划于2026H2、2027H2分别推出VeraRubinNVL144平台与更高规格的RubinUltraNVL576平台。1)VeraRubinNVL144平台采用RubinGPU与VeraCPU组合设计。RubinGPU包含两颗Reticle尺寸核心、具备50PFLOPS(FP4精度)算力及288GBHBM4显存;VeraCPU提供88个定制Arm核心、176线程且NVLINK-C2C互联带宽达1.8TB/s,该平台性能相较上一代GB300NVL72提升约3.3倍,FP4推理算力3.6Exaflops、FP8训练算力1.2Exaflops,系统总显存带宽13TB/s、快速存储容量75TB;2)而RubinUltraNVL576作为迭代产品,硬件与性能全面升级。NVL规模从144扩展至576,CPU架构不变,GPU升级为四颗Reticle尺寸核心(单颗性能最高100PFLOPSFP4精度、搭载1TBHBM4e显存)。该平台性能较GB300NVL72提升14倍,FP4推理算力15Exaflops、FP8训练算力5Exaflops,HBM4显存带宽4.6PB/s、快速存储容量365TB,NVLINK通信能力提升12倍(最高1.5PB/s),整体算力、存储及连接效率大幅跃升。

  投资建议:建议关注NVIDIA服务器国产供应链的持续成长机遇。

  风险提示:1)国际贸易摩擦加剧2)下游需求不及预期3)技术升级进度滞后

  发布Vera Rubin超级芯片

  2025年10月29日,NVIDIA CEO黄仁勋在美国华盛顿举行的GTC大会上发表主题演讲,不仅展示了下一代超级芯片VeraRubin的原型机,更提出了“AI不是工具,而是会用工具的工人”这一颠覆性观点。


爱建证券 许亮,朱俊宇
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。