黄仁勋在GTC演讲中称推理让算力需求暴增100倍
腾讯科技特约作者 苏扬、郝博阳

Blackwell全家桶上线
1)年度“核弹”Blackwell Ultra在挤牙膏

NVLink历代性能参数
2)Blackwell Ultra NVL72:AI推理专用机柜


-
服务器厂商 Cisco/Dell/HPE/Lenovo/超微等15家制造商 -
云厂 AWS/Google Cloud/Azure/Oracle云等主流平台 -
算力租赁服务商 CoreWeave/Lambda/Yotta等
3)提前预告真“核弹”GPU Rubin芯片

4)Blackwell Ultra版DGX Super POD“超算工厂“

-
内置DGX GB300(Grace CPU ×1+Blackwell Ultra GPU ×2) 的DGX SuperPOD,总计288颗Grace CPU+576颗 Blackwell Ultra GPU,提供300TB的快速内存,FP4精度下算力为11.5ExaFLOPS -
内置DGX B300的DGX SuperPOD,这个版本不含Grace CPU芯片,具备进一步的扩展空间,且采用的是风冷系统,主要应用场景为普通的企业级数据中心
5)DGX Spark与DGX Station

6)RTX横扫AI PC,还要挤进数据中心
-
桌面GPU:,包括RTX PRO 6000 Blackwell 工作站版、RTX PRO 6000 Blackwell Max-Q工作站版、RTX PRO 5000 Blackwell、RTX PRO 4500 Blackwell 以及RTX PRO 4000 Blackwell -
笔记本GPU:RTX PRO 5000 Blackwell、RTX PRO 4000 Blackwell、RTX、PRO 3000 Blackwell、RTX PRO 2000 Blackwell、RTX PRO 1000 Blackwell以及RTX PRO 500 Blackwell -
数据中心 GPU:NVIDIA RTX PRO 6000 Blackwell服务器版


英伟达Photonics
站在队友肩膀上的CPO系统

-
Quantum 3450-LD:144个800GB/s端口,背板带宽115TB/s,液冷 -
Spectrum SN6810:128个800GB/s端口,背板带宽102.4TB/s,液冷 -
Spectrum SN6800:512个800GB/s端口,背板带宽409.6TB/s,液冷

模型效率PK DeepSeek
软件生态发力AI Agent

1)Nvidia Dynamo,英伟达在推理领域构建的新CUDA



2)Llama Nemotron新模型秀高效,但还是打不过DeepSeek


3)新模型只是英伟达AI Agent生态的前菜,NVIDA AIQ才是正餐




人形机器人基础模型发布
英伟达要做具身生态全闭环
1)Cosmos,让具身智能理解世界


2)Isaac GR00T N1,世界第一个人形机器人基础模型


4)数据生成,双管齐下

3)三位一体算力体系,打造从训练到端的机器人计算帝国



