从Vera Rubin到PC芯片:黄仁勋的野心计算一切

2026年06月01日 17:25   21世纪经济报道 21财经APP   倪雨晴
攻入英特尔和AMD腹地。

21世纪经济报道记者倪雨晴

6月1日的英伟达GTC大会上,新一代GPU Rubin不是唯一主角。

从Vera Rubin全面量产,到面向Agentic AI打造的Vera CPU;从企业AI Agent工具链,到进入Windows生态的PC超级芯片RTX Spark、DGX Station超级计算机;再到Cosmos 3、DRIVE Hyperion、宇树H2 Plus人形机器人的合作,英伟达正在把AI产业叙事进一步推向“建设AI工厂、运行AI Agent、进入物理世界”的新阶段。

以上三大产品路线,映射了英伟达创始人兼CEO黄仁勋对AI的最新判断。黄仁勋在演讲中提到:“实用AI(Useful AI)已经到来。”在他看来,AI堪称GDP“生成器”,Token需求非常旺盛,计算需求飙升。

过去几年,全球AI产业的核心叙事是算力扩张。谁能获得更多高端GPU,谁就能更快训练大模型。但随着大模型能力不断提升,产业瓶颈正在发生变化。训练仍然重要,但推理、Agent、多模态生成、自动驾驶仿真、机器人训练和企业级部署,正在成为新一轮基础设施需求的来源。

因此,在这次GTC和即将开始的COMPUTEX电脑展上,英伟达展示的不只是一组产品路线图,而是一套更加完整的AI工业体系。

英伟达的AI版图,正在从数据中心向企业、PC和物理世界继续外扩。

Vera Rubin全面量产 Vera CPU成为新焦点

在数据中心侧,Vera Rubin是英伟达此次发布的核心平台之一,将在下半年发货,接棒GB200、GB300。

按照英伟达的定义,Vera Rubin面向AI Factory,已经进入全面量产爬坡阶段。它不是单一芯片,而是POD级(计算集群级)平台。

Vera Rubin是英伟达迄今规模最大的计算集群平台——五个专门打造的机柜作为一个庞大的AI超级计算机协同运行,以支持Agent工作负载。该平台将NVIDIA Vera Rubin NVL72、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX(存储芯片,强调安全)以及NVIDIA Spectrum-6 SPX(基于CPO的交换机)以太网机柜统一整合为一个完整系统。

背后的重点在于,英伟达正在把数据中心从GPU服务器堆叠,推进为机柜级、POD级的整体系统。Vera Rubin不只是GPU升级,而是把CPU、GPU、网络、存储、安全和机柜架构整合为AI工厂单元。其性能指标也发生了变化,英伟达称,与上一代Grace Blackwell平台相比,Vera Rubin在大规模部署下可提供10倍的Agent吞吐能力。

过去,AI基础设施更多强调训练性能、浮点算力和GPU数量。而在Agentic AI时代,英伟达开始强调Agent吞吐、Token成本、任务完成速度和数据中心Token收入。这也是新平台中Vera CPU(数据中心CPU)值得重点关注的原因。

英伟达将Vera定义为“AI时代的CPU”,并称其是“首款为Agentic AI打造的CPU”。目前,Vera已进入全面量产,据悉相较x86 CPU可实现1.8倍更快的任务完成速度,用于驱动Agentic AI、强化学习和数据处理等多类工作负载,并带来更多数据中心Token收入。

(Vera CPU,图源:英伟达)

这释放出一个重要信号,在AI工厂中,CPU重新回到关键路径。黄仁勋甚至在演讲中表示,英伟达已经是全球最大的CPU制造商之一。

大模型训练时代,GPU是绝对主角。但进入Agent时代后,计算任务不再只是一次性生成文本,而是多步骤推理、检索、工具调用、代码执行、上下文管理和结果评估。Agent需要运行Python、Java、数据库处理、沙箱环境和编排逻辑,这些环节往往依赖CPU。如果CPU成为瓶颈,GPU就可能在等待数据、等待指令和等待任务调度中被拖慢。

换言之,Agentic AI改变了AI数据中心的负载结构。AI工厂的经济学也从“每美元对应多少核心”转向“每美元对应多少Token”。在这一逻辑下,CPU不再只是GPU旁边的主机处理器,而是影响Agent吞吐、交互速度和Token收入的重要变量。

从技术规格看,Vera由英伟达自研Olympus CPU core驱动,拥有88个Olympus核心、空间多线程技术,以及LPDDR5X内存子系统,内存带宽最高达到1.2TB/s。Vera被设计用于处理更多指令、预测应用行为,并在大量并发环境、查询和数据处理任务之间移动数据,从而减少Agent在CPU受限步骤上的等待时间,让AI工厂中的加速器保持运转。

同时,Vera也服务于英伟达更完整的系统架构。作为Vera Rubin平台的主机CPU,Vera通过第二代NVIDIA NVLink-C2C互连技术与GPU连接,提供CPU与GPU之间最高1.8TB/s的一致性带宽。这意味着,英伟达正在通过CPU-GPU紧耦合的数据通路,进一步提升AI工厂端到端效率。

更值得注意的是,戴尔、惠普、联想等企业将提供Vera独立CPU服务器配置。英伟达称,这是x86之外的首个标准CPU选项。这意味着,英伟达正在从GPU优势领域进一步进入服务器CPU战场,并试图在AI数据中心中提供x86之外的新标准选项。

联手Windows,英伟达猛攻PC芯片

而英伟达和x86的竞合,不只发生在数据中心,已经来到PC桌面端。

在英特尔、AMD长期主导的x86 PC之外,英伟达正联合微软、联发科和一众PC厂商,试图用“GPU+Arm CPU+Windows+AI Agent”的组合,重新定义PC(个人计算机)。

在GTC上,英伟达发布NVIDIA RTX Spark,这是一款全新PC超级芯片,用于笔记本电脑等PC品类。黄仁勋表示,英伟达将联手Windows重新定义PC,这是专为AI Agent设计的Windows平台。

(RTX Spark,图源:英伟达)

硬件结构上,RTX Spark超级芯片搭载Blackwell RTX GPU,拥有6144个CUDA核心和支持FP4精度的第五代Tensor Cores,并通过NVLink-C2C芯片间互连技术,将GPU连接至一颗高性能20核Grace CPU。值得注意的是,联发科作为基于Arm架构系统级芯片设计领域的重要厂商,与英伟达合作参与了这一定制CPU设计,这颗CPU也是外界传言中的“N1X”。

天风国际证券分析师郭明錤近日表示:“根据供应链信息,未来两年基于N1X的设备出货量约为1000万台。 产品仍属利基市场,针对需要设备端AI计算的资深用户。出货量是否会上调取决于价格,但主要取决于Windows是否能提供真正协调设备端AI计算的应用程序和工作流程。”

而英伟达的这一路线首先指向PC市场的新一轮竞争。过去数十年,Windows PC市场主要由英特尔、AMD等x86平台定义;而在AI PC和个人AI Agent时代,英伟达与联发科的合作,某种程度上代表Arm阵营在高性能Windows PC市场继续扩张。

与此同时,高通也在推动Arm架构Windows PC,英特尔和AMD则持续强化x86 AI PC平台。由此,PC市场的新竞争不再只是“谁的CPU更强”,而是x86与Arm、高性能GPU与本地AI模型、操作系统安全能力与Agent生态之间的综合竞争。

而英伟达对新PC的定义,并不是简单加入一个NPU,而是把本地大模型、创意生产、游戏图形和个人Agent统一到同一平台中。也正因如此,Adobe正在为RTX Spark重新架构Photoshop和Premiere,一众软件和游戏开发者,也在拥抱RTX Spark平台。

在硬件生态上,英伟达正在推动RTX Spark进入主流PC厂商。RTX Spark驱动的轻薄Windows笔记本和小型台式机预计将由华硕、戴尔、惠普、联想、Microsoft Surface和MSI在今年秋季推出。

但RTX Spark只是英伟达PC端布局的一端,此外还有更高阶的DGX Station for Windows。这是一款面向专业人士的终极桌面AI超级计算机,它将数据中心级的GPU和CPU集成到预装 Windows的桌面系统中。严格来说,DGX Station不应被简单称作“一款Windows PC”,更像是Windows形态的AI超级工作站,预计第四季度推出。

一位业内人士向记者指出,长期以来,训练、微调、大规模推理和多Agent开发等重型企业AI工作负载,通常需要运行Linux的数据中心系统。但大量公司的日常生产力、创意、设计和工程应用运行在Windows上,DGX Station for Windows试图弥合这一断层。

由此看来,英伟达在PC端形成了两层布局。RTX Spark面向更广泛的个人AI计算机,把本地Agent、创意工作流、前沿模型带入笔记本;DGX Station则面向企业开发者、研究人员、工程师、设计师和数据科学家,把GB300级AI基础设施放到桌边,用于开发和运行更复杂的前沿Agent。英伟达试图借此将其AI平台从数据中心和专业工作站,进一步下沉到更广泛的Windows PC生态。

从Agent到物理AI 英伟达拓展AI新边界

在PC生态中,英伟达可不只有芯片,还有一整套Agent体系。

或者说,从更长的产业链条看,PC端只是英伟达Agentic AI布局的一部分。英伟达真正想做的,是把Agent从底层算力、模型、运行时,到企业工作流和物理世界开发流程,串联成一套完整体系。

一方面,英伟达通过NemoClaw、Nemotron 3 Ultra、OpenShell和CUDA-X技能库进入企业软件工作流;另一方面,则通过DGX Station for Windows把前沿Agent能力带入企业桌面。

前者能够面向工程设计、芯片验证、工业仿真、网络安全和企业运营等专业场景,后者则为开发者、研究人员、工程师、设计师和数据科学家提供本地Agent运行环境。

这意味着,Agent不再只是大模型应用层的“聊天机器人”,而开始成为连接算力、软件、数据、工具和工作流的新界面。英伟达发布的NVIDIA Agent Toolkit软件,正是围绕这一目标打造。它包括NemoClaw蓝图、Nemotron模型、OpenShell安全运行时以及具备Agent技能的CUDA-X库。

但英伟达的目标并不止于数字世界。更进一步,Agent正在从数字任务走向物理世界,这也是英伟达反复强调Physical AI的重要原因。

所谓物理AI,指向的是能够在真实物理环境中感知、推理、规划和行动的智能系统,包括自动驾驶、机器人、工业视觉、智慧工厂、医疗机器人和数字孪生等场景。与纯数字Agent相比,物理AI面临更复杂的问题,数据采集成本高,长尾场景难覆盖,仿真和现实之间存在差距,安全验证门槛更高,部署环境也更不可控。

具体布局上,Cosmos 3是英伟达在物理AI上的基础模型,英伟达称,Cosmos 3可以将物理AI训练和评估周期从数月缩短至数天。这表明,英伟达试图用世界模型降低物理AI开发门槛。

在自动驾驶领域,英伟达一方面扩大DRIVE Hyperion平台生态,另一方面推出Alpamayo 2 Super等模型和工具。其中,DRIVE Hyperion被定位为Robotaxi-ready平台,围绕这一平台,英伟达正在推动Robotaxi生态扩张。比如,富士康扩大与英伟达的战略合作,计划开发和部署L4-ready Robotaxi车队,并计划在2028年推出相关服务。

模型层面,Alpamayo 2 Super是英伟达面向Robotaxi的重要布局。它是一个开放的320亿参数推理型视觉—语言—动作模型,能够在完整驾驶栈中进行推理、规划和行动,面向更安全、可扩展的L4自动驾驶开发。

机器人方面,英伟达与宇树科技在H2 Plus人形机器人上合作,这是基于NVIDIA Isaac GR00T开发平台的开放人形机器人参考设计。宇树提供“身体”,英伟达则提供“计算和大脑”。英伟达试图提供一套机器人开发参考标准,对于人形机器人行业而言,真正的难点并不只是硬件本体,还包括数据采集、仿真训练、策略学习、模型评估和真实部署。

此外,英伟达还发布了一组开源Physical AI Agent Skills and Tools,覆盖Omniverse、Cosmos、Alpamayo和Metropolis,用于机器人、自动驾驶、视觉AI和工业数字孪生。这些工具的作用,是把复杂的物理AI训练、评估和部署流程,变成可重复、优化过、Agent可以执行的任务。

从这个角度看,英伟达的Agent布局正在形成一个闭环。在数据中心,Vera Rubin支撑大规模Agentic AI运行;在桌面端,RTX Spark和DGX Station把Agent能力带入个人和企业PC;在企业端,NemoClaw、Nemotron 3 Ultra、OpenShell和CUDA-X技能库让Agent进入专业工作流;在物理世界,Cosmos、DRIVE Hyperion、Alpamayo、Isaac GR00T和Physical AI Skills则让Agent参与自动驾驶、机器人和工业系统开发。

这也正是英伟达拓展AI新边界的方式,它正不断把自身能力向外延伸。随着AI从训练转向推理,英伟达试图把每一层关键基础设施都纳入自己的生态。

关注我们