从Vera Rubin到PC芯片：黄仁勋的野心计算一切

2026年06月01日 17:25 21世纪经济报道 21财经APP 倪雨晴

攻入英特尔和AMD腹地。

21世纪经济报道记者倪雨晴

6月1日的英伟达GTC大会上，新一代GPU Rubin不是唯一主角。

从Vera Rubin全面量产，到面向Agentic AI打造的Vera CPU；从企业AI Agent工具链，到进入Windows生态的PC超级芯片RTX Spark、DGX Station超级计算机；再到Cosmos 3、DRIVE Hyperion、宇树H2 Plus人形机器人的合作，英伟达正在把AI产业叙事进一步推向“建设AI工厂、运行AI Agent、进入物理世界”的新阶段。

以上三大产品路线，映射了英伟达创始人兼CEO黄仁勋对AI的最新判断。黄仁勋在演讲中提到：“实用AI（Useful AI）已经到来。”在他看来，AI堪称GDP“生成器”，Token需求非常旺盛，计算需求飙升。

过去几年，全球AI产业的核心叙事是算力扩张。谁能获得更多高端GPU，谁就能更快训练大模型。但随着大模型能力不断提升，产业瓶颈正在发生变化。训练仍然重要，但推理、Agent、多模态生成、自动驾驶仿真、机器人训练和企业级部署，正在成为新一轮基础设施需求的来源。

因此，在这次GTC和即将开始的COMPUTEX电脑展上，英伟达展示的不只是一组产品路线图，而是一套更加完整的AI工业体系。

英伟达的AI版图，正在从数据中心向企业、PC和物理世界继续外扩。

Vera Rubin全面量产 Vera CPU成为新焦点

在数据中心侧，Vera Rubin是英伟达此次发布的核心平台之一，将在下半年发货，接棒GB200、GB300。

按照英伟达的定义，Vera Rubin面向AI Factory，已经进入全面量产爬坡阶段。它不是单一芯片，而是POD级（计算集群级）平台。

Vera Rubin是英伟达迄今规模最大的计算集群平台——五个专门打造的机柜作为一个庞大的AI超级计算机协同运行，以支持Agent工作负载。该平台将NVIDIA Vera Rubin NVL72、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX（存储芯片，强调安全）以及NVIDIA Spectrum-6 SPX（基于CPO的交换机）以太网机柜统一整合为一个完整系统。

背后的重点在于，英伟达正在把数据中心从GPU服务器堆叠，推进为机柜级、POD级的整体系统。Vera Rubin不只是GPU升级，而是把CPU、GPU、网络、存储、安全和机柜架构整合为AI工厂单元。其性能指标也发生了变化，英伟达称，与上一代Grace Blackwell平台相比，Vera Rubin在大规模部署下可提供10倍的Agent吞吐能力。

过去，AI基础设施更多强调训练性能、浮点算力和GPU数量。而在Agentic AI时代，英伟达开始强调Agent吞吐、Token成本、任务完成速度和数据中心Token收入。这也是新平台中Vera CPU（数据中心CPU）值得重点关注的原因。

英伟达将Vera定义为“AI时代的CPU”，并称其是“首款为Agentic AI打造的CPU”。目前，Vera已进入全面量产，据悉相较x86 CPU可实现1.8倍更快的任务完成速度，用于驱动Agentic AI、强化学习和数据处理等多类工作负载，并带来更多数据中心Token收入。

（Vera CPU，图源：英伟达）

这释放出一个重要信号，在AI工厂中，CPU重新回到关键路径。黄仁勋甚至在演讲中表示，英伟达已经是全球最大的CPU制造商之一。

大模型训练时代，GPU是绝对主角。但进入Agent时代后，计算任务不再只是一次性生成文本，而是多步骤推理、检索、工具调用、代码执行、上下文管理和结果评估。Agent需要运行Python、Java、数据库处理、沙箱环境和编排逻辑，这些环节往往依赖CPU。如果CPU成为瓶颈，GPU就可能在等待数据、等待指令和等待任务调度中被拖慢。

换言之，Agentic AI改变了AI数据中心的负载结构。AI工厂的经济学也从“每美元对应多少核心”转向“每美元对应多少Token”。在这一逻辑下，CPU不再只是GPU旁边的主机处理器，而是影响Agent吞吐、交互速度和Token收入的重要变量。

从技术规格看，Vera由英伟达自研Olympus CPU core驱动，拥有88个Olympus核心、空间多线程技术，以及LPDDR5X内存子系统，内存带宽最高达到1.2TB/s。Vera被设计用于处理更多指令、预测应用行为，并在大量并发环境、查询和数据处理任务之间移动数据，从而减少Agent在CPU受限步骤上的等待时间，让AI工厂中的加速器保持运转。

同时，Vera也服务于英伟达更完整的系统架构。作为Vera Rubin平台的主机CPU，Vera通过第二代NVIDIA NVLink-C2C互连技术与GPU连接，提供CPU与GPU之间最高1.8TB/s的一致性带宽。这意味着，英伟达正在通过CPU-GPU紧耦合的数据通路，进一步提升AI工厂端到端效率。

更值得注意的是，戴尔、惠普、联想等企业将提供Vera独立CPU服务器配置。英伟达称，这是x86之外的首个标准CPU选项。这意味着，英伟达正在从GPU优势领域进一步进入服务器CPU战场，并试图在AI数据中心中提供x86之外的新标准选项。

联手Windows，英伟达猛攻PC芯片

而英伟达和x86的竞合，不只发生在数据中心，已经来到PC桌面端。

在英特尔、AMD长期主导的x86 PC之外，英伟达正联合微软、联发科和一众PC厂商，试图用“GPU+Arm CPU+Windows+AI Agent”的组合，重新定义PC（个人计算机）。

在GTC上，英伟达发布NVIDIA RTX Spark，这是一款全新PC超级芯片，用于笔记本电脑等PC品类。黄仁勋表示，英伟达将联手Windows重新定义PC，这是专为AI Agent设计的Windows平台。

（RTX Spark，图源：英伟达）

硬件结构上，RTX Spark超级芯片搭载Blackwell RTX GPU，拥有6144个CUDA核心和支持FP4精度的第五代Tensor Cores，并通过NVLink-C2C芯片间互连技术，将GPU连接至一颗高性能20核Grace CPU。值得注意的是，联发科作为基于Arm架构系统级芯片设计领域的重要厂商，与英伟达合作参与了这一定制CPU设计，这颗CPU也是外界传言中的“N1X”。

天风国际证券分析师郭明錤近日表示：“根据供应链信息，未来两年基于N1X的设备出货量约为1000万台。产品仍属利基市场，针对需要设备端AI计算的资深用户。出货量是否会上调取决于价格，但主要取决于Windows是否能提供真正协调设备端AI计算的应用程序和工作流程。”

而英伟达的这一路线首先指向PC市场的新一轮竞争。过去数十年，Windows PC市场主要由英特尔、AMD等x86平台定义；而在AI PC和个人AI Agent时代，英伟达与联发科的合作，某种程度上代表Arm阵营在高性能Windows PC市场继续扩张。

与此同时，高通也在推动Arm架构Windows PC，英特尔和AMD则持续强化x86 AI PC平台。由此，PC市场的新竞争不再只是“谁的CPU更强”，而是x86与Arm、高性能GPU与本地AI模型、操作系统安全能力与Agent生态之间的综合竞争。

而英伟达对新PC的定义，并不是简单加入一个NPU，而是把本地大模型、创意生产、游戏图形和个人Agent统一到同一平台中。也正因如此，Adobe正在为RTX Spark重新架构Photoshop和Premiere，一众软件和游戏开发者，也在拥抱RTX Spark平台。

在硬件生态上，英伟达正在推动RTX Spark进入主流PC厂商。RTX Spark驱动的轻薄Windows笔记本和小型台式机预计将由华硕、戴尔、惠普、联想、Microsoft Surface和MSI在今年秋季推出。

但RTX Spark只是英伟达PC端布局的一端，此外还有更高阶的DGX Station for Windows。这是一款面向专业人士的终极桌面AI超级计算机，它将数据中心级的GPU和CPU集成到预装 Windows的桌面系统中。严格来说，DGX Station不应被简单称作“一款Windows PC”，更像是Windows形态的AI超级工作站，预计第四季度推出。

一位业内人士向记者指出，长期以来，训练、微调、大规模推理和多Agent开发等重型企业AI工作负载，通常需要运行Linux的数据中心系统。但大量公司的日常生产力、创意、设计和工程应用运行在Windows上，DGX Station for Windows试图弥合这一断层。

由此看来，英伟达在PC端形成了两层布局。RTX Spark面向更广泛的个人AI计算机，把本地Agent、创意工作流、前沿模型带入笔记本；DGX Station则面向企业开发者、研究人员、工程师、设计师和数据科学家，把GB300级AI基础设施放到桌边，用于开发和运行更复杂的前沿Agent。英伟达试图借此将其AI平台从数据中心和专业工作站，进一步下沉到更广泛的Windows PC生态。

从Agent到物理AI 英伟达拓展AI新边界

在PC生态中，英伟达可不只有芯片，还有一整套Agent体系。

或者说，从更长的产业链条看，PC端只是英伟达Agentic AI布局的一部分。英伟达真正想做的，是把Agent从底层算力、模型、运行时，到企业工作流和物理世界开发流程，串联成一套完整体系。

一方面，英伟达通过NemoClaw、Nemotron 3 Ultra、OpenShell和CUDA-X技能库进入企业软件工作流；另一方面，则通过DGX Station for Windows把前沿Agent能力带入企业桌面。

前者能够面向工程设计、芯片验证、工业仿真、网络安全和企业运营等专业场景，后者则为开发者、研究人员、工程师、设计师和数据科学家提供本地Agent运行环境。

这意味着，Agent不再只是大模型应用层的“聊天机器人”，而开始成为连接算力、软件、数据、工具和工作流的新界面。英伟达发布的NVIDIA Agent Toolkit软件，正是围绕这一目标打造。它包括NemoClaw蓝图、Nemotron模型、OpenShell安全运行时以及具备Agent技能的CUDA-X库。

但英伟达的目标并不止于数字世界。更进一步，Agent正在从数字任务走向物理世界，这也是英伟达反复强调Physical AI的重要原因。

所谓物理AI，指向的是能够在真实物理环境中感知、推理、规划和行动的智能系统，包括自动驾驶、机器人、工业视觉、智慧工厂、医疗机器人和数字孪生等场景。与纯数字Agent相比，物理AI面临更复杂的问题，数据采集成本高，长尾场景难覆盖，仿真和现实之间存在差距，安全验证门槛更高，部署环境也更不可控。

具体布局上，Cosmos 3是英伟达在物理AI上的基础模型，英伟达称，Cosmos 3可以将物理AI训练和评估周期从数月缩短至数天。这表明，英伟达试图用世界模型降低物理AI开发门槛。

在自动驾驶领域，英伟达一方面扩大DRIVE Hyperion平台生态，另一方面推出Alpamayo 2 Super等模型和工具。其中，DRIVE Hyperion被定位为Robotaxi-ready平台，围绕这一平台，英伟达正在推动Robotaxi生态扩张。比如，富士康扩大与英伟达的战略合作，计划开发和部署L4-ready Robotaxi车队，并计划在2028年推出相关服务。

模型层面，Alpamayo 2 Super是英伟达面向Robotaxi的重要布局。它是一个开放的320亿参数推理型视觉—语言—动作模型，能够在完整驾驶栈中进行推理、规划和行动，面向更安全、可扩展的L4自动驾驶开发。

机器人方面，英伟达与宇树科技在H2 Plus人形机器人上合作，这是基于NVIDIA Isaac GR00T开发平台的开放人形机器人参考设计。宇树提供“身体”，英伟达则提供“计算和大脑”。英伟达试图提供一套机器人开发参考标准，对于人形机器人行业而言，真正的难点并不只是硬件本体，还包括数据采集、仿真训练、策略学习、模型评估和真实部署。

此外，英伟达还发布了一组开源Physical AI Agent Skills and Tools，覆盖Omniverse、Cosmos、Alpamayo和Metropolis，用于机器人、自动驾驶、视觉AI和工业数字孪生。这些工具的作用，是把复杂的物理AI训练、评估和部署流程，变成可重复、优化过、Agent可以执行的任务。

从这个角度看，英伟达的Agent布局正在形成一个闭环。在数据中心，Vera Rubin支撑大规模Agentic AI运行；在桌面端，RTX Spark和DGX Station把Agent能力带入个人和企业PC；在企业端，NemoClaw、Nemotron 3 Ultra、OpenShell和CUDA-X技能库让Agent进入专业工作流；在物理世界，Cosmos、DRIVE Hyperion、Alpamayo、Isaac GR00T和Physical AI Skills则让Agent参与自动驾驶、机器人和工业系统开发。

这也正是英伟达拓展AI新边界的方式，它正不断把自身能力向外延伸。随着AI从训练转向推理，英伟达试图把每一层关键基础设施都纳入自己的生态。

从Vera Rubin到PC芯片：黄仁勋的野心计算一切

2026年06月01日 17:25 21世纪经济报道 21财经APP 倪雨晴

相关新闻

热文排行

财经日历

每日智库看点

关注我们

公告