#567. 黄仁勋：Agent 时代普通人和企业的新生产力，AI 基础设施竞赛下的计算革命

完整转录稿

Podcast 跨国串门儿计划 2026-06-02 07:45

摘要

整体概括

这场 GTC Taiwan keynote 的核心判断非常明确：Agentic AI 已经从概念阶段进入现实阶段，AI 不再只是生成内容，而是开始直接产出可衡量的工作、收入和 GDP。黄仁勋用软件开发、Token 需求、AI Factory 和企业级工具栈说明，未来的竞争不只是模型本身，而是谁能把模型、harness、工具、记忆和 runtime 组织成可规模化运行的系统。换句话说，AI 正在从“会回答问题”走向“会做工作”，而支撑这种变化的关键不只是芯片，更是覆盖芯片、机架、网络、供电、散热、安全和软件的完整基础设施。

他在演讲里反复强调，NVIDIA 正从 GPU 公司、系统公司，进一步变成基础设施公司。Grace、Vera、Vera Rubin、NVLink、BlueField、Mellanox、Omniverse、Cosmos、Nemotron、Cadence、RTX Spark、DGX Station、Isaac GR00T，这些名字共同指向同一个方向：把 AI 从云端扩展到企业、PC、汽车和机器人，让每一种计算设备都能承载 agent、推理和自动化工作流。台湾供应链、合作伙伴和制造能力在这套体系里不是配角，而是从一开始就参与到 AI 计算革命的核心位置。

主要内容

1. Agentic AI 已经到来，计算模式正在重写

演讲开头，黄仁勋把这轮变化定义为 Agentic AI 的落地。他认为，过去软件的基本结构是 application、code、operating system，而现在的新结构是 model、harness、tools、memory 和 runtime 共同组成的 agent。这个 agent 不再只是读取上下文，而是会观察、推理、规划、调用工具并执行行动。模型负责“思考”，harness 负责“编排”，工具负责“做事”，记忆系统负责长期和短期记忆，runtime 则把这一切连接起来。也正因为如此，AI 不是单一模型的升级，而是新的计算范式。

他用软件开发者的生产力来解释这种变化：全球数千万软件开发者产生了巨大的经济价值，而随着 AI 工具和 agent 进入开发流程，Token 的需求会被迅速放大。对他来说，Token 不再只是模型输出的中间产物，而是能直接变成收入和利润的盈利单位。AI 公司因此会持续建设更多 Token、更多 AI Factory，也会需要更多算力和更强的基础设施。

2. 从 Grace 到 Vera Rubin：AI Factory 的底层逻辑

在基础设施层面，黄仁勋把重点放在 Grace、Vera、Vera Rubin 和 AI Factory 上。他强调，AI 的竞争不只是芯片性能，而是整套系统效率：CPU、GPU、NVLink、DPU、网络、存储、供电、散热、安全和调度必须协同设计。Vera Rubin 不是单颗芯片，而是一整套面向 agent 的系统，目标是把推理、记忆、工具调用和编排全部纳入一台可规模化运行的机器里。

他花了大量篇幅讲 AI Factory 的全栈设计。真正的工厂不是把机架堆起来就结束，而是在落地前就要通过 DSX、数字孪生和 blueprint 完成布局、供电、冷却、网络和集成验证；一旦上线，系统又要负责监控、配置和修复。黄仁勋把这套逻辑概括为：compute 就是收入，效率就是利润，AI Factory 的每一层都要以最高效率和最高韧性运行。台湾的供应链、制造伙伴、封装、网络和数据中心能力，都在这条链路里扮演关键角色。

3. 企业级 Agent 工具栈：模型、工具、技能、runtime

黄仁勋进一步解释了企业如何真正用上 agent。他提出一套面向企业 AI 的 Toolkit：首先是更聪明、更便宜、更快的大语言模型；其次是 harness，用来编排整个流程；第三是带技能的工具库；最后是把这一切连接起来的 runtime。NVIDIA 既提供开放模型，也提供可运行的 agent 环境，让企业可以运行自己的 agent，也可以运行 Claude Code、Codex 这样的第三方 agent。

他特别强调安全和权限控制的重要性。agent 不只是能做事，还必须在企业内部被安全地约束、授权和审计，因此 OpenShell/OpenShell Sandbox 这类环境、权限系统、隐私保护和身份管理都成为企业操作系统的一部分。对他来说，这意味着未来企业里的 AI 不是一个孤立应用，而是一整套“现代企业操作系统”。

4. 芯片设计 Super Agent 与 Nemotron

在芯片设计场景里，黄仁勋把 agent 进一步具体化为“Super Agent”。NVIDIA 与 Cadence 合作，让 agent 直接参与 RTL 生成、仿真、验证、回归测试和调试。这样做的意义不是让工程师少干活，而是把过去需要数周的验证循环缩短到更高效、更自动化的节奏，让芯片设计能在数字世界里持续迭代。

与之配套的是 Nemotron 开放模型。黄仁勋强调，NVIDIA 不只是开放模型，还开放数据和训练方式，让客户和伙伴能够在此基础上构建自己的专有能力。Nemotron 在这里不是单纯的语言模型，而是支撑企业 agent、设计 agent 和行业 agent 的基础模型之一。

5. 物理 AI：从汽车到机器人

这场演讲后半段，重点逐渐转向物理 AI。黄仁勋用 Cosmos、Omniverse 和自动驾驶模型说明，AI 不只是语言模型，也可以通过仿真、合成数据和 world model 去理解物理世界并输出动作。自动驾驶汽车被他定义为一种 agentic robot，而人形机器人则是下一个更复杂的终端形态。

在这一段里，他介绍了面向自动驾驶汽车的开放模型，以及面向人形机器人的 Isaac GR00T 开发平台。这个平台把模型、仿真、训练库、数据生成器和机器人计算机连成完整管线，让研究者和开发者不必从零搭建所有基础设施，就能更快地把示范数据、合成数据、策略训练和部署串起来。机器人时代在他看来并不是未来概念，而是已经开始的系统工程。

6. PC、Windows 机器和个人 AI 超级计算机

黄仁勋还把 agentic AI 进一步带进个人设备。他介绍了 RTX Spark、DGX Station 以及新的 Windows 机器产品线，强调未来的 PC 不再只是打开应用和打字的工具，而会逐渐演变成一台“家里的 AI 超级计算机”。这些设备可以本地运行 agent、个人助手和开发环境，让用户把 AI 直接带到桌边、家里甚至离线环境中。

他对未来 PC 的判断很明确：手机已经从“打电话的机器”变成了“什么都做的机器”，PC 也会经历同样的转变。未来几年，个人电脑、工作站、台式机和笔记本都会围绕 agent、模型和本地推理重新设计，形成一条新的产品线。

关键 takeaway

Agentic AI 已经不是概念，而是已经到来的生产力形态。
AI 的核心价值正在从“生成内容”转向“完成工作”。
Token、算力和 AI Factory 将成为新的收入与利润来源。
企业 AI 需要模型、harness、工具、技能和 runtime 的完整栈。
NVIDIA 正在从 GPU 公司演化为基础设施公司。
Vera Rubin、Nemotron、Omniverse、Cosmos、Cadence 和 Isaac GR00T 分别覆盖了芯片、模型、仿真、自动驾驶和机器人。
未来的 PC、服务器、汽车和机器人都会共享同一种 agentic 计算模式。

Agentic AI 与工具调用 [00:00:00 - 00:10:00]
工具编排与 AI 工厂 [00:10:00 - 00:20:00]
算力成本与网络升级 [00:20:00 - 00:30:00]
全栈系统与 AI 工厂 [00:30:00 - 00:40:00]
Agent 工具栈与企业操作系统 [00:40:00 - 00:50:00]
芯片设计 Super Agent [00:50:00 - 01:00:00]
Vera Rubin 与 N1X 芯片 [01:00:00 - 01:10:00]
三类 Windows 机器与机器人 [01:10:00 - 01:20:00]
物理 AI 与多终端平台 [01:20:00 - 01:30:00]
Isaac GR00T 开放平台 [01:30:00 - 01:35:09]

Agentic AI 与工具调用

一凯：欢迎收听跨国串门计划。这是一档专注于让中文听众无障碍欣赏全球优质外语播客的节目。通过先进的AI声纹克隆技术,我们不仅将内容翻译成中文,还完美保留了原主持人和嘉宾的独特声音,为您呈现全球顶尖的AI财经、健康与科技领域精品内容。我是主播一凯，一位热衷于AI领域的产品经理，很荣幸能为您搭建这座跨越语言障碍的桥梁，接下来让我为您简单介绍本期我们克隆的这档节目，并分享几句非常精彩的原话，本期我们克隆的是Yahoo Finance 在2026年6月1日更新的NVIDIA GTC Taipei 2026 Jensen Huang Full Keynote 这是一场科技与财经交汇的完整主题演讲，主讲人是NVIDIA创始人兼CEO黄仁勋，他回到台湾，在GTC Taiwan的舞台上，面向全球产业伙伴谈AI计算和基础设施的下一阶段，他在演讲里有几句话特别有代表性，下一波AI是Agentic AI 今天我们可以说Agentic AI已经到来了，有用的AI已经到来了 AI现在是利润生成器 AI现在是GDP生成器 Compute现在就是收入 Compute就是利润，过去我们为人类创造CPU 而人类只有十亿人，未来会有数十亿个agent 这些话背后是一整套，关于未来计算的宏大判断，接下来就让我们一起进入，这场完整keynote 欢迎来到GTC Taiwan [00:00:54]

黄仁勋：很高兴见到大家回家的感觉真好，我也把父母带回来了，我的父母在哪里，大家给我的爸爸妈妈一点掌声，也请把掌声送给我们，开场秀的超级明星们，各位，看看他们多可爱，台湾的超级明星，今天现场来了这么多人，我们现在也正在向台湾各地，另外70个Watch Party直播 70场不同的活动，正在同时进行，大家都在看这场Keynote 我们有太多内容要告诉大家，也有太多合作伙伴要感谢，我们在台湾的生态系统，已经发展到这么大，真的不可思议，大多数人一想到生态系统，想到的是我们的software stack 想到的是NVIDIA打造的计算系统之上的开发者生态，但NVIDIA的生态系统一直延伸到上游，延伸到我们在台湾的整个供应链，也就是一切开始的地方，在一路向下游延伸到数据中心，最后到终端用户，今天我们几乎会谈到整个生态系统，要感谢的人太多了，我很爱我在这里的生态系统，这里有太多公司，也有一些我最喜欢的生态合作伙伴，台湾有这么丰富的生态系统，最丰富的生态系统，世界上最好的供应链，生态系统，真的不可思议，谢谢大家，今天来到这里，今年我们共同的业务，增长得非常惊人，事实上昨晚有人告诉我，台湾今年的年度GDP 可能会增长接近10%不可思议，我们有很多内容要讲，那就开始吧，几年前我来这里的时候，开始和大家谈 AI如何从Generative AI 继续向后面的几波AI演进，下一波AI是Agentic AI 今天我们可以说 Agentic AI已经到来了，有用的AI已经到来了，这是什么意思，这是GitHub 当然 Agentic AI最早的应用之一，就是软件编程，软件开发是最有价值的职业之一，也有一个极其庞大的生态系统，全球有3000万到4000万，专业软件开发者，另外可能还有几亿学生和爱好者等等，简单说，世界上有3000万到4000万软件开发者，靠写代码谋生，而这张图基本代表了他们中的大多数，这是GitHub，Pull Request是他们下载软件，修改软件 Commit是他们把修改再推回去，如果你看这张图 2023年的Commit数量是3亿次 2024年是4亿次 2025年是5亿次，到2026年的前几个月Commit 数量已经接近翻了三倍，这意味着什么，三千万，软件开发者代表大约三万亿美元的GDP 也就是他们创造的价值，那是他们拿到的薪酬，每年三万亿美元的工资，这些工资又在为其他行业带来经济增长，可以说，全球一百万亿美元的产业，都受到这些薪酬所创造的工作的影响和推动，我刚才说成三十亿美元了，不对，是3万亿美元 3万亿美元的薪酬，现在产出了接近三倍的成果，也就是说，用3万亿美元的薪酬，实际产生了相当于9万亿美元的生产力，这样说合理吗，这个差别非常惊人，这就是AI的潜力，也是AI的承诺工程师，软件工程师的数量实际上正在增加，有人说AI会减少工作岗位，这完全是胡说 AI正在让更多软件工程师被雇用，原因很简单，如果你雇一名软件工程师，就能产生9万亿美元规模的有效工作，为什么不雇更多软件工程师呢，如果那条线是平的，那显然大家会少雇软件工程师，但因为产出增长得如此惊人，大家会想雇更多软件工程师，这很快会以某种方式体现在我们的经济里，所以第一件事是，有用的AI已经到来了，从行业角度看，这意味着什么，从行业角度看，这意味着Token的需求正在变得极其强劲，因为如果你能做到这一点，你就会想生产更多，而且现在Token已经是能盈利的单位 Token已经是能带来收入的盈利单位，因为它现在能盈利 AI公司就想构建更多Token 生成更多Token 建设更多AI Factory 这也正是台湾这里 Compute需求暴增的原因，也正是为什么你们所有人都这么忙，业务表现这么好的原因，事实上那张图看起来，有点像你们中一些公司的股价 Compute的模式已经变了，一切都变了，所以第一个观点是，有用的AI已经到来了 AI现在是利润生成器 AI现在是GDP生成器，在它背后是一种全新的计算模式，不只是large language model 而是agent 今天我们几乎所有要讲的内容，都会建立在这个基础上，所以我花一点时间，快速给大家解释，我说的是什么，这里面是一个agent 它是一个agent应用，过去这里会是application 这里会是code 这里会是operating system 也就是application code 运行在application里面，在运行在operating system里面，今天它是agent，agent由一个或多个large language model组成，放在一个harness里面 harness帮助它编排，让它完成有生产力的工作，这是输入，当输入进来之后，它必须理解观察推理行动，并使用工具，使用工具，这个工具可以是电子表格，网页浏览器，数据处理引擎，或者数据库引擎 Harness会编排信息的路由，每一次接触到信息，它都要处理Context 理解发生了什么，推理，接下来该做什么，制定一个可以执行的计划，然后按计划行动，这条编排路径是由软件来编排的，所以从根本上说，这就是一个agent 它会处理短期记忆，也就是working memory，也会处理长期记忆，就像我们人一样，我们也有长期记忆，所以memory管理系统极其重要，整个系统就叫agent 大语言模型，负责思考harness 像操作系统一样，把所有东西连接在一起，这就是新的计算模型，这就是agent 它能做非常了不起的事情，这次重大突破是几个东西，同时汇聚在一起，大语言模型，现在已经能很好的思考，推理，规划和使用工具，同时，我们现在也有了这些harness 能管理memory 编排流程，使用工具，于是我们就能做，很了不起的事情，我给大家举几个例子，这是一个prompt 这是一个prompt 这是生成出来的代码，然后得到这个结果，这是输入，这是输入，那是输出，你们觉得怎么样很厉害，对吧，我们这里用的是Claude Code 不过codex也做得非常出色，这里还有一个例子，这是输入创建一个gif nvidia 绿色原点在黑色背景上散开，组成台北101大楼 [00:09:36]

工具编排与 AI 工厂

黄仁勋：组成台北101大楼，再变形成GTC Taipei 2026 然后变成NVIDIA标志，再散开并重复，所以你们刚才看到的就是那个prompt 还有下一个例子，我的遥控器电池盖丢了，它长这样，创建一个CD文件，它会使用工具，创建一个可以直接用于CD打印的CD文件，来做一个新的电池盖，明白了吗，这就是现在新的计算模式，过去我们是启动一个应用，点击然后输入，现在我们把这件事换成像AI 解释我们想要什么，也就是我们的intent 然后AI生成代码，或者使用工具，产出所需的结果，未来的计算机就会这样工作，这就是agentic AI 过去两年，我们一直朝这个方向建设，现在它已经到来了，其中一个重大突破，当然就是工具使用，很多人说 Jensen AI要来了 Agentic AI要来了，所以所有软件公司都会倒闭，我说情况正好相反，因为会出现非常多的agent 这个世界不再受限于人的数量，所以这些agent 会比以往使用更多工具，对软件公司来说，这其实是一个非常了不起的时代，但软件必须以agent能使用的方式，呈现给agent 这是一个重大突破，事实上我们已经做了这件事，你们知道NVIDIA的宝藏是什么吗，就是我们所有的CUA库，我把它们叫做CUDA X 库，这是NVIDIA的宝藏，今天我们已经能够把这些CUDA X 库，呈现给agent 让他们使用，而且agent使用它们的效果，甚至比人类更高效，所以对Codex库来说，现在是一个非常美好的时代，我们来看一下 20年前我们打造了Cuda 这是用于加速计算的单一架构，我们重新发明了计算，上千个CUDA X 库，帮助开发者在科学和工程的每一个领域取得突破 CUDA X 库就是给agent使用的工具 Kalitho用于计算光刻 CUopt用于决策优化 CUDSS用于直接吸收求解器 AIQ用于跨结构化和非结构化文档，做深度研究 Ariel用于AI ReinWarp用于可微分物理，Parabricks用于基因组，学它们的基础是算法，而这些算法非常美，请为数学鼓掌，数学很美，软件的计算模式将会改变，事实上我们回到这张图，这就是agent 它是终极的解耦式，分布式计算模型，为了处理这个agent 会有许多不同的计算机被激活 agent由model harness tools skills和runtime组成，所有这些东西都运行在不同的地方，在数据中心里，你可以把model想成大脑，把harness想成身体，把它使用的tools和运行，它们的runtime想成一个工作坊，所以这就像一个人在工作坊里，拿着工具干活，当然这件事是在极其大的规模上完成的，而且每一个步骤都运行在计算机的不同部分，你可以看到，大语言模型在思考，处理context 观察，理解环境，推理，制定计划，并执行计划，每一次发生这些事情时，一整柜Grace Blackwell NVLink 72都会被激活，他在用大语言模型思考，每当他使用工具时，就会用到CPU 这个工具可以是C编译器，可以是Python 可以是JavaScript 也可以是加速计算，今天的agent使用工具，还相对简单，明天他们会成为，非常复杂，非常成熟的工具使用者，这就是为什么，我刚才展示的CUDA X 库，会在agent当中，变得极其受欢迎，它们解决的是世界上最重要的一些问题，我们所有的CUDA X 库，现在都会配套skills 让AI学会怎么使用它们，所以CUDA X 库加上一些skills 基本上就是一本手册 AI读完之后会说，原来是这样用的 agent 使用这些库的能力会非常惊人，所以工具会跑在CPU GPU和大语言模型上，安全Harness跑在CPU上，也跑在一个叫DPU的安全处理器上，也就是NVIDIA的BlueField 所有这些的编排都跑在CPU上，这就是完整的Harness CPU负责协调所有工作，最难的部分之一是内存，你可以想象工作内存叫KV Caching 要记住什么，怎样做压缩整理，这里不只是压缩，还包括怎样取回信息，你是取回结构化数据，还是取回非结构化数据 Ontology是什么，这些不同数据彼此之间是什么关系，这一整套处理极其复杂 AI的内存系统，会让存储系统发生彻底变革，你可以看到，这种计算模型，这种计算模式，以及agent这种新应用的每一个方面，都和过去应用运行的方式根本不同，过去是一大堆软件，放在一个二进制文件里，再放在操作系统里运行，正因为这种解耦的，分布式的，异构的计算问题，才是我们打造下一代 Vera Rubin的原因 Vera Rubin不是一颗芯片 Vera Rubin也不只是GPU 它从GPU开始，但Vera Rubin远不止于此，这一整套东西都是Vera Rubin 从端到端它有GPU 有Vera Rubin 有NVLink 72 它由Vera CPU来编排，我后面会更详细地讲，存储系统也会被革命性地改变 Vera加上CX9 还有我们叫DOCA的软件站，以及里面的安全处理器，这样一来，所有东西，无论是静态存储中，传输中，还是使用中，都会被加密，这套系统里的所有环节都是安全的，因为AI model太宝贵了，这就是为什么整个系统，都遵循confidential computing 这里面每一个系统本身，都足以成为一次完整的革命 Vera Rubin 是我们公司历史上，最有雄心的工程，全公司所有四万名工程师，都参与了 Vera Rubin 更不用说你们所有人，你们所有人，也都参与了这整套系统的创造 Vera Rubin真的是一个奇迹，而且它不只是一颗芯片，而是很多很多东西，其实还不止这些，很久以前 NVIDIA曾经是一家GPU公司，但这些年来，我们已经发展成一家系统公司，你现在看到的是，有史以来从零开始设计的，最复杂系统，也是最复杂的整体系统，但归根到底，我们的客户和合作伙伴，并不想买计算机，他们想建设AI Factory 这就是为什么 NVIDIA又一次真正开始转型，你可以看到，我们大量技术，现在已经扩展到，整个基础设施规模，我们的合作伙伴，也到了基础设施规模，包括发电冷却系统，电网供应商，许多工业公司，现在都成了我们，生态系统的一部分，因为说到底，我们想打造的是一整套Full Stack 就像GPU一样，就像我们打造Grace Blackwell NVLink 72一样，现在我们也在打造一整套Full Stack System 让客户能够建设出惊人的AI Infrastructure 我们来看一下，全世界都在竞相建设AI Factory 这是人类历史上最大规模的基础设施建设 AI Factory极其复杂，每一层从芯片、机架、网络，到供电冷却和电网，都必须端到端一起设计，因为compute就是收入，NVIDIA DSX是一套蓝图，也是一套reference design 用来以最高效率和最高盈利能力建设，并运营AI factory 它从DSX-SIM开始，接触DSX-SIM和Omniverse Blueprint 合作伙伴，可以在一台机架落地之前，就设计并验证一座NVIDIA Vera Rubin AI Factory 他们规划布局模拟供电和冷却，设计网络，验证每一个集成环节，并在Digital Twin里测试每一次改动，工厂一旦上电 DSX OS就会接管配置，运行监控，并修复基础设施，它会把已经安装好的系统，变成可信的，多租户的，有韧性的，随时可用于AI的capacity 今天的AI Factory供电，最多会超额配置40%，DSX Max LPS 让运营商可以在同样的功率预算内，安全地部署更多GPU 从而每年增加数十亿美元收入 [00:19:51]

算力成本与网络升级

黄仁勋：从而每年增加数十亿美元收入，突破性的45摄氏度热液冷却，可以使用更少的水和能源，让更多电力流向能产生收入的compute 令人惊叹的动态功率分配，可以把电力从一个机架，调到另一个机架，回收被闲置的瓦特数，把它们送到真正有工作负载的地方，机架内的功率平滑技术，会消贫整个工厂里的峰值，电流尖峰和电力浪涌，多组AI Agent 会和DSX Max LPS持续协同，协调冷却和供电，以满足workload需求 DSX AI Factory是灵活的能源资产，可以和电网协同运行 DSX Flex会读取实时电网信号，并动态调整工厂功率，当电网需要减压时，它就会响应，到这个十年结束前，将有100几瓦的AI Factory上线 NVIDIA DSX AI Factory 会以最高效率运行，生产成本最低的Token 并让电网更强，过去我给大家看过，生态系统的幻灯片，讲的是NVIDIA的计算层，软件以及软件和计算站，怎么集成到别人的平台里，也就是第三方平台和库，去服务各个终端市场，那是一个计算生态系统，现在这个是AI工厂生态系统，它在你们所有人的下游，对我来说，你们所有人都在上游，对我们来说，下游就是这个生态系统，因为NVIDIA最终不只是造GPU 也不只是造系统，我们是在帮助客户建设这些AI工厂，建设这些复杂到极点的AI基础设施，每一个一级瓦级别的项目，一开始是200亿 300亿美元，现在已经是500亿 600亿美元，很快会到800亿 1000亿美元，每一级瓦1000亿美元，投入到一座AI工厂里，它必须第一次就能跑起来，而且必须马上跑，好资本成本高的惊人，复杂度也高的惊人，所以大家可以看到，我们过去是在计算机里设计一颗芯片，后来是在计算机里模拟一个系统，今天你们刚刚看到，一切都是在Omniverse里建出来的，我已经和在座各位一起做Omniverse很久了，现在这个梦想终于成真了，在真正破土动工，真正投入资金之前，我们就可以在一个数字框架里，在一个数字模拟器里，在一个数字世界里，先把这些巨型系统建出来，世界想建多大，我们就能在里面先建多大，所以这就是我们的生态系统，我们叫它DSX RTX是给GPU用的 DGX是给系统用的，现在DSX基本上就是给基础设施用的，因为我们在整个站上做了这些工作，包括我们的系统和软件，所以我们才能和小公司合作，让他们也能成为世界级的AI Cloud 我接下来要给大家看的这些公司，每一家不久前都还是小公司，现在CoreWeave的价值已经达到500亿 600亿 700亿美元，而且还在以惊人的速度增长，最近我们也和Nebius合作，他们同样增长得非常快，这些Cloud 每一家都有非常了不起的客户 Cursor是做软件编码的公司 Black Forest Labs 做图像生成 Word Labs 做World Foundation Model Revolut 是领先的金融服务AI公司，还有Shopify 这里还有一家Nscale 他们的客户，包括British Telecom和Google Google正在使用我们的一家AI Cloud Thinking Machines是一家Frontier Labs公司，我们对此非常兴奋，这里是韩国的Naver Cloud 客户有Bank of Korea Hyundai，还有很多非常了不起的公司，这里是印度的一家Yotta 也有非常了不起的公司，这里还有一家总部，在新加坡正在澳大利亚一起建设，客户包括Together AI和AI Singapore 这是印度尼西亚的一家，这些公司每一家都在服务区域客户，也在服务全球客户 AI会在每一个地方运行，每一家公司都会由AI驱动，每一个地区都会建设自己的AI 这里有印度尼西亚的OCAT 这里在台湾有GMI 台湾的GMI可以鼓掌，这些公司都非常了不起，机会也非常了不起，但他们都需要几样东西，当然他们需要计算站，下面这一整套站，就是让NVIDIA成名的东西，我们所有的硬件，软件和库，以及我们和全球第三方，开发者生态系统的连接，让任何人都有可能，搭起一个AI Cloud 但是现在AI Cloud 已经复杂到这种程度，这是软件版本，这是计算机科学版本，从资金角度看，从资产角度看，就是我前面给大家看的那个东西，一座巨大的工厂，只有这种能力还不够，这就是为什么NVIDIA现在，已经成为一家 AI基础设施公司，把这件事做好，变得极其擅长部署，擅长帮助客户建设AI工厂，部署AI工厂，变得非常重要，原因就在这里 compute 现在就是收入 compute就是利润，没有收入和利润就是亏损，所以必须认识到这一点，这是一个AI基础设施上线的例子，它可能很快上线，也可能需要一段时间，它的吞吐量可能高，也可能低，它的韧性和可靠性可能好，也可能差，它有用的生命周期可能很长，也可能很短，因为这代表的是500亿 600亿美元，并且正在走向1000亿美元，所以这条曲线非常重要，这也是为什么Invendia 是这么好的合作伙伴，为什么要和我们合作，因为我们有完全整合的能力，我们不只是做了一张 PowerPoint幻灯片，我们创造了整套基础设施，我们把所有东西连接在一起，我们自己建设了价值数十亿美元，数百亿美元的系统，来确保一切都能正常工作，正因为如此，我们的Time to First Token 我们的Time to First Inference 我们把训练启动起来，所需要的时间都要快得多，第二，因为我们的每瓦吞吐量，我们的每瓦Token数绝对是世界级的，原因是我们把一切都整合在一起，我们从零开始设计一切，模拟整个系统，并且采用极致的协同设计，就像我刚才给大家展示 Vera Rubin机架时那样，所有东西都是为了交付，这种惊人的吞吐量而设计的，如果你的Data Center 如果你的工厂有一几瓦，它就不会有更多，一几瓦就是一几瓦，你能提供的电力就这么多，如果你有一几瓦电力，那么每瓦吞吐量就是收入，因为每一个Token都是有利润的，每一个Token都是收入，这就是未来 Compute就是收入，每瓦性能就是你的收入，只是因为芯片更便宜，就选择错误的架构，这并不能转化为收益，也没有意义，你必须确保你的每瓦收入，你买得越多赚得越多，所以关键是每瓦能产出多少 Token 还有一点不对，第二点，第三点是可靠性，如果你有机会去看这些数据中心，会发现里面有太多活动部件，数百万根线缆，要让所有计算机协调工作，可靠性本来就非常难保证，这件事极其困难，我们已经在超大规模环境里运行了很长时间，这些经验很重要，平均中断间隔的差异非常重要，最后这也非常难，这些系统的生命周期很关键，因为软件一直在变化，四年前也就是Hopper的时代 AI已经完全变了，六年前也就是Ampere的时代 AI也已经完全变了，一开始我们谈的是CNN 后来我们谈Transformer 再后来我们谈mixture of experts 现在我们谈的是agentic systems 每一代甚至每隔几个月，软件行业都会拿出新技术，如果你的架构不够灵活，如果你的生态不够丰富，这条曲线就不可能拉长，你无法预测你的系统到底能用多久，但我可以，NVIDIA系统遍布全球，软件开发者从NVIDIA CUDA开始，所以从定义上说，这个生态，这项有用资产的寿命会涨得多，差别本质上就是成本，你可以把它看成收入 [00:29:45]

全栈系统与 AI 工厂

黄仁勋：你可以把它看成收入，但收入的另一面就是成本，如果资产寿命长 TCO就低，这就是差别，这就是compute 变成收入时的样子，你买得越多赚得越多，现在你们所有人，都在和我一起经历这件事，对吧，你们的需求都很强，你们的工厂在非常努力地运转，台湾各地的人都在非常努力地工作，因为每个人都想赚钱，大家意识到，有用的AI已经来了，能赚钱的AI已经来了 compute需求高得惊人，而compute需求就是约束，所以让我们非常非常努力地工作，帮助全世界把AI factories到处建起来，这就是为什么它如此重要，我很高兴，今天站在你们面前 Vera Rubin已经全面量产 Vera Rubin已经全面量产，我们为Vera Rubin打造的供应链，规模是Grace Blackwell的两倍，这非常不可思议，过去组装一台 Grace Blackwell rack需要两个小时，现在只需要五分钟，所以不只是产能更高 throughput也快得多，而这些我们全都需要，才能支撑需求，这个生态系统非常了不起，为了支持Grace Blackwell 并为现在正在爬坡的 Vera Rubin做准备，数百万平方英尺的产能，已经上线，我要感谢你们所有人 Vera Rubin现在已经全面量产，谢谢，我们来看一看，大语言模型能生成答案，现在AI Agent能完成工作，但处理Agentic AI是完全不同类型的问题智能体会观察、推理、规划、使用工具，他们要管理巨大的Context 同时处理工作记忆和长期记忆，他们还会按需启动Subagents 也就是专门的智能体 NVIDIA Vera Rubin是一个Multirack Podscale系统，专门用来处理Agentic AI 它现在已经全面量产，供应链上的制造自动化和调度协同，亲眼看到就是一个奇迹，我们的旅程始于第一台AI超级计算机 NVIDIA DGX-1 接下来十年，我们把每一颗芯片，每一个系统都推到极限，从Pascal和第一代NV-Link 到Grace Blackwell 也就是第一台RackScale AI超级计算机，现在是Vera Rubin 第一台为Agentic时代打造的Multirack Podscale超级计算机，一切从TSMC开始，组成Vera Rubin的7颗新芯片，要经过数百道工序成型 3nm制程COSR和COSL封装HBM4内存，来自Micron、SK Hynix和三松 Vera Rubin Computer Board上有6万亿个晶体管，一块板上超过18000个组件 Vera Rubin Envelope 72 负责思考，也就是Prompt和Context 理解、推理和规划，接下来是全新的模块化Compute Tray 采用新的PCB Midplane设计结构，更精简 Superchips、ConnectX9、SuperNICs 和BlueField4 DPU 全部就地连接，不用线缆，从而在AI Factory规模下提高韧性，18个Compute Trays 9个可热插拔的NVLink Switch Trays 还有全新的高效率夜冷busbar 承载超过5000安培电流，这相当于20辆电动汽车，全力加速时的电流，合在一起130万个组件，构成了这第三代MGX rack设计，祝贺Microsoft 他们的Vera Rubin NVL72 Engineering rack 已经投入运行，也祝贺Dell和CoreWeave 他们也已经搭建起自己的 Vera Rubin NVL72 Engineering Rack 接下来是Vera CPU Rack 一个液冷机架里有256颗CPU 用来编排模型，调度内存启动工具，在Foxconn和Quanta GR3LPX开始成型 16个Tray里放入256个GR3LP，它有每秒40PB的SRAM带宽，用来实现超低延迟 NVLink 72负责用最高吞吐量生成Token 而GRLPX负责用最低延迟生成Token Vera BlueField 4 STX是AI保存记忆的地方，它的存储处理由BlueField 4加速，把内存存储、芯片级安全，以及NVIDIA Spectrum X Ethernet Photonics连接在一起，这是全球第一款带200GB Copackaged Optics的Ethernet Switch 采用TSMC的COUP制成芯片级封装，以及基于零化iGene的超高功率激光二极管 Vera Rubin 把五套RackScale系统连接在一起，组成一台面向AI Agent的Supercomputer 台湾有150家供应链伙伴，参与其中数百万平方英尺的工厂，空间数百个地点，芯片，封装系统和数据中心，都被推到了尺寸，功耗和规模的极限，这就是我们说的 Extreme Co-Design 我们和台湾一起做到了，我们一起为AI时代，重新发明了计算，台湾从一开始，就和我们站在一起，今天我们也和台湾，一起把Vera Rubin带给世界，谢谢台湾，各位女士们，先生们Vera Rubin Vera Rubin 不只是为AI打造的 Vera Rubin 不只是为了运行AI Vera Rubin是为了运行agent 打造的，这是一套agentic system 想象一下它的复杂度，这也证实为什么agent 是最后一个计算机科学突破 agent，花了这么多年才真正发挥潜力，变得有用，所以运行agent的计算机，也理应是世界上，最先进的计算机，这就是Vera Rubin 我们来看一下，可以把Vera Rubin请出来吗 Janine我们有那些机架吗，系统在吗，看起来很重，这就是Vera Rubin Vera Rubin NVLink 72 这是LPX Rack 下一次GTC 我会花更多时间讲它，今天我们还有太多内容要讲，这是Vera CPU Rack 256颗CPU全部夜冷，等一下我会给大家介绍Vera 这是Vera BlueField存储处理系统，同时也是安全系统，当然这也是我们的 Mellanox Networking 全球第一款CPU 这就是Vera Rubin 令人难以置信的技术，现在全部汇聚到一起，当我们打造Hopper的时候，大家知道 Hopper是为Pretraining打造的，当时Pretraining是最重要的应用，也是我们正在处理的，最重要Workload 后来我们做Grace Blackwell的时候，所有人都说 Jensen,NVIDIA很擅长 Pre-training,Inference太简单了，你们还记得吗，以前人们总说 Inference太简单了，我们也能做，但大家知道 Inference就是钱，而贸易模型非常复杂，要在响应极快交互极快的同时，还保持高吞吐量，难度极高，这就是为什么，我们今天创造了NVLink 72 今天NVIDIA的token成本，是全球最低的，不是低10% 而是低很多倍，是数量级的差距，这一切都因为我们做了 extreme cosign 因为我们理解inference的计算模型，和计算模式，所以才能创造出NVLink 72 现在有了Vera Rubin 它已经超越inference 它现在是在agentic system里的inference 这就是Vera Rubin 没有线缆，没有软管，没有风扇，上一次我给大家展示它的时候，到处都是线缆，那些线缆看起来很壮观，但现在中间有一块PCB 把两边连接起来，过去需要两个小时的事情，现在只要五分钟 Vera Rubin的可靠性和韧性，会高得惊人，这是我们的Vera CPU Tray 是有史以来最先进的CPU 等一下我就给大家看，这是我们的Storage Tray 两颗Vera CPU，四个CX9 还有大量软件，这是我们新的LPX LPU30 也就是为超低延迟Inference设计的GR System 吞吐量由Vera Rubin提供，并通过NVLink 72扩展，如果你还想进一步扩展，就可以使用LPU 这里是Vera Rubin NV-Link的Switch Tray 中间这些就是Switch 这是革命性的，因为有了Vera Rubin 因为有了NVLink 72 也因为我们创造和发明了NVLink Switch 这是我们用于Scale-out的Ethernet Switch 很了不起的是，我们为Grace Blackwell 推出了这两套系统，这两套系统最初就是为Grace Blackwell打造的，今天NVIDIA已经是全球最大的Networking公司，我为Networking团队感到非常自豪，它为我们所做的一切提供了极其强大的支撑 [00:39:54]

Agent 工具栈与企业操作系统

黄仁勋：它为我们所做的一切提供了极其强大的支撑，接下来我要讲，我们将要参与的下一个重大产业，谢谢你珍妮，谢谢，我想后面大概有2000个人在拉它，好，我们来讲CPU Vera CPU是为AI时代打造的CPU 到目前为止，所有CPU都是为人而造的，我们是用户，我们是使用者，我们是租用者，我们使用CPU的方式，是生活在按秒计算的世界里，我们在云端租CPU也是这样 CPU core越多，就越能出租，就CPU的使用场景，就CPU的经济逻辑，和agent有根本不同 agent很没耐心，他们不是生活在按秒计算的世界里，而是生活在按纳秒计算的世界里，当他使用一个工具，他希望响应时间越快越好，当他访问数据库，结果必须尽快回来 agent每多等一刻，就会被挡在下一步，下一步再下一步之前，所以我们必须把CPU的延迟，做到尽可能低，交互性做到尽可能强，因此我们为AI时代打造了Vera CPU 在我们的系统里它有三种用法，第一种当然是Vera Rubin 用来思考在Vera Rubin Rack里面已经有两颗CPU 大家知道我们正在制造并销售数百万套Vera Rubin 我们已经卖出了数百万套Grace Blackwell NVIDIA已经是世界上最大的CPU制造商之一，在Vera Rubin Rack里有两颗Vera CPU，一颗负责调度和管理GPU 管理KV Cache 处理Rack里运行的所有软件，我们还有Grace BlueField 用于安全和隔离 Vera Compute用于Harness 也就是AI模型的编排，工具使用，数据库访问，数据服务器，就在这里 Vera BlueField最快的存储，最快的存储服务器，世界上有史以来，最快的存储系统，这之所以如此重要，是因为agent正在访问内存，而且访问速度快得惊人，这些系统存储服务器和CPU 现在成了数据中心里，最昂贵部分的关键路径，这一部分最贵，是有充分理由的，原因在于经济逻辑 AI factory的经济逻辑，就是token token是在这里生成的，所以当然，你希望制造并生成，尽可能多的Token 这里就是你投入，全部经济价值的地方，而CPU不能挡路，所以Vera CPU 对Vera 对CPU架构提出了巨大压力，这也是我们从零开始，打造全新架构的原因，这是一颗世界从未见过的CPU 我们称它为Vera 这是一颗为Agent打造的CPU 过去所有CPU 都是为人类打造的，这颗CPU是为agent打造的，有四件事需要记住，也就是四个要点，第一个要点是 Vera的美食中指令数必须非常强，因为我们需要把延迟做短，我们需要的是处理时间，是单线程性能，不是吞吐量，单线程性能必须是世界级的，它必须拥有绝对最好的单线程性能，这就是为什么Vera的IPC 也就是每时钟指令数会这么高，它是全球最高的，每个时钟周期抓取解码，并执行10条指令，这是第一点，第二点 CPU搬出数据所需要的带宽，也必须是绝对世界级的，第二件事是每个Core的带宽，第三件事就是总带宽，请记住我前面说过 Agentic Systems 从根本上就是解偶的分布式的，解偶的分布式的，当计算被解偶被分布之后，网络就成了问题，所以我们必须尽可能快地移动数据，在CPU Core之间，在CPU和存储之间，在CPU和GPU之间，系统周围的带宽，以及CPU Core内部的带宽，都必须是绝对世界级的，这是很长时间以来，第一颗这样打造的CPU 它真的把极限推到了非常激进的位置，用Fabric连接所有CPU Core 这个速度接近光速 3.6TB每秒，没有Triplet Tax 没有跨芯片边界的开销，因为我们需要所有东西都在一起，因为CPU Core之间，要用极高带宽彼此通信，它们现在不是一颗Core 一颗Core一颗Core的被出租，它们是在一起协同工作 Vera的横截面带宽高得惊人，它是第一颗支持PCI Express Gen6的CPU 它也是第一颗配备LPDDR5X的CPU 带宽达到1.2TB每秒，是最高性能CPU的2到3倍，外部带宽是3倍，内部带宽也是3倍，每个Core的带宽，以及整体带宽都是世界级的，现在请记住，我前面给大家看过CPU Core的数量 CPU的数量会非常高，原因很简单，过去我们为人类创造CPU 而人类只有十亿人，未来会有数十亿个agent 这些agent使用CPU时，几乎不会有耐心，因为他们旁边的GPU成本太高，所以太有价值，太珍贵，因此这些CPU不仅要性能强，还必须极其节能，这样我们才能在Factory里，塞进尽可能多的CPU 同时不夺走用于生成Token的电力，而我们知道，生成Token才是我们赚钱的方式，这四个属性定义了Vera 每十种指令数，也就是单线程性能，每个Core的带宽，芯片周围和芯片内部的总带宽，以及能效，它绝对是世界级的，当你把它和最高性能的X86相比，它的表现高得惊人，用真实的单线程性能，真实性能来比较，它也是高得惊人 CPU能提升5% 已经非常了不起，能提升10% 也非常了不起，但这种性能加速，简直闻所未闻，这就是NVIDIA Vera 你们觉得怎么样，我们来看一看 Agentic AI改变了CPU的角色，现在CPU是指挥 GPU是乐团，传统CPU是为另一个时代打造的，它追求每个sock里尽可能多的core，把它们切分虚拟化，再按小时出租，到了agent的时代 CPU现在成了GPU利用率的瓶颈，会直接影响token吞吐量，延迟和用户体验 NVIDIA Vera就是为agentic loop打造的CPU 它把NVIDIA定制的数据中心CPU Core 和可扩展的一致性Fabric结合起来，在性能Core和带宽之间取得合适平衡，让AI Factory的产出最大化 Vera的核心是NVIDIA Olympus Core 它面向现代数据中心工作负载打造，比如大量分支的Python Runtime Tool Call 以及Sandbox里的代码执行，每个Core都针对吞吐量做了调效，神经网络分支预测器，每个Cycle可以评估两个Taken Branch，实录Decode Engine 让每个Cycle都能带进更多工作，大型Out-of-order Engine 让指令持续流动，高级Pre-fetch还配了新的Graph Engine 可以预判下一条数据路径，但是只有在数据正确准时到达时，快速的Core才真正有意义 Vera是第一款使用LPDDR5X memory的CPU 同时还能同时纠正多个错误，而且不牺牲带宽，和X86相比 Vera的峰值 Memory Latency降低了40% 在Retrieval Analytics和Sandbox Execution 这些场景里，它能让Core按时拿到数据 NVIDIA第二代可扩展Edressing Fabric 把全部88个Olympus Core 统一在一个Monolithic Mesh上，并用独立die来处理Memory和IO Core没有被拆到不同芯片上，所以Core到Core的通信速度，比传统CPU和Memory架构快50% 支持Memory Coherent的NV-Link Chip-to-Chip 可以把GPU直接连到Fabric上，不只是GPU NV-Link Chip-to-Chip 还可以把Vera扩展到多个SCOG 让CPU之间获得巨大的带宽 Vera的Agent Sandbox性能是X86 CPU的1.8倍，独立的Vera Rack可以运行Agent Sandbox Tool, Code和Data Pipeline 和Rubin GPU紧密偶合 Vera能让加速工作流持续跑起来 NVIDIA Vera BlueField 4 Spectrum X支撑Context Memory和AI Storage 也就是Compute Networking Storage，Vera就是Agent时代的CPU 这会成为我们新的主要增长引擎，评测已经出来了，结果相当不错，真的很不错，现在请记住 [00:49:48]

芯片设计 Super Agent

黄仁勋：现在请记住 Grace和Vera 也是AI世界里验证最充分的CPU 因为每一个Data Center 每一个Cloud 每一家Enterprise 每一家和NVIDIA 一起做AI的公司，都已经验证过Grace 整个software stack都已经为Grace做过优化，每家公司也都会验证Vera Vera会成为世界上优化最充分的Agentic CPU 原因很简单，它会和Vera Rubin一起出现，原因也很简单，我们已经完成了那次重大的硬切换，事实上，在Grace Blackwell的过渡过程中，最大的风险就是从外部X86 CPU 切换到Grace Blackwell 那次转换极其危险，但我们靠非常出色的执行做到了，现在Grace几乎已经和Grace Blackwell 画上等号，人们说Blackwell的时候，就会说Grace Blackwell 因为它现在已经无处不在，每家公司的software stack 都已经为它做过优化，每个人的security stack 也都已经为它做过优化，现在Vera要来了，我对此非常兴奋，现在来看一些性能数字 speed up是一回事，但要把SQL加速是极其困难的 SQL是迄今为止最著名的domain specific language 也就是DSL 你知道在COA之前有SQL 在Omchail之前也有SQL SQL是IBM发明的，今天它是整个地球的结构化数据库，引擎，每个人都在用SQL 这里是SQL跑快三倍，不是快10% 也不是快25% 而是快三倍，这太了不起了，这是实时的，下一个是Real-Time Stream Processing 请记住，你的AI不只是会读文档，你的AI还会监控Telemetry 尤其是在工厂内部，在证券交易所内部，你会持续不断地查看Telemetry 涌进来的突发数据会进入CPU 这里是Vera CPU为New York Stock Exchange 跑Real-Time Stream Processing New York Stock Exchange的总裁Lynn Martin 非常慷慨，和我们建立了合作，这个系统在全世界实时运行 Real-Time Stream Processing Vera CPU快6倍，这一切都来自带宽，单线程指令执行 Core之间的内部带宽，还有Vera，外部的带宽，都是完全革命性的，这就是Vera 你知道大家谈GPU的时候，经常会谈到多少倍的性能提升，但在真实Workload上，尤其是和CPU相关的，真实Workload上，很少有人会谈到这种，倍数级提升，所以我为团队感到非常骄傲，你们做得太棒了，我们接下来，有一条非凡的road map 但真正令人兴奋的是，几乎所有人都在支持Vera 他们和我们一样兴奋，这就是Vera打开的机会，它打开了一个全新的市场 Agent Agent是一种新的workload 过去我们为人类打造CPU 现在我们需要为Agent 为Agentic System打造CPU 它们需要的特性不一样，那为什么旧的CPU还会一样呢，我们正在制造数以百万计的 Vera 台湾的ODM 电脑制造商，还有所有OEM 都会和我们一起进入市场，你也可以看到早期采用者，早期采用者就是那些 Agentic Companies 这是一个新市场的开始，一个过去从未存在过的市场，它不会从旧市场里抢走需求，但这是一个新市场，是给Agent用的CPU 这个市场肯定会比上一个市场更大，原因是agent的数量会比人多得多，而且agent非常没有耐心，所以这就是NVIDIA VERA CPU 谢谢，这张其实是最重要的幻灯片，这就是大家要带走的重点，这里的重点是，这是未来十年的应用模式，也是未来十年的计算模式 agent harnesses 会编排大语言模型，每家公司都会运行它，每家公司都会成为Agent公司，每家公司内部都会有Agent在运行，每家公司都会看到 Agent需要自己的操作系统，每家公司都在问我们，怎么安全地运行Agent 怎么为自己的工作负载构建Agent 所以我们有NVIDIA Agent Toolkit 用于企业AI 你们其实已经看着我一路公开地把它搭起来了，几乎NVIDIA做的所有事情，大家在每一届GTC都能看到，如果你回头看我五年前或者十年前的GTC 你会发现今天这些内容我已经讲了好几年，因为我们一直在为这一刻做准备，公司要构建agent as a service 或者构建能运行的agent需要四样东西，第一你需要模型，当然是大语言模型，越聪明越好，越便宜越好，越快越好，第二你需要一个harness 来编排整套系统，第三这些模型想要使用工具，而这些工具带着自己的技能，我刚才给你们展示了 CUDA X libraries 它们未来会成为 agent非常强大的工具，最后你需要一个runtime 你需要一个操作系统，把所有东西连接在一起，这就是NVIDIA Toolkit for 智能体它包含你可以修改的模型，也就是NVIDIA世界级的开放模型，后面我会展示更多，你也可以运行任何人的agent 你可以运行Claude Code 这是非常强大的agent 也可以运行Codex 也是非常强大的agent 你可以把它运行在一个叫 OpenShell的Harness里面，它在企业内部会非常安全 Shall会保护Agent 让它始终受安全策略约束，隐私会受到保护，它的权限和特权会被授予，它的身份也会受到保护，所以这个OpenShell 正在全世界被采用 NVIDIA OpenShell是开源的，你可以看到，很多公司已经采用了它，包括Red Hat, Canonical Microsoft也会采用，它会到处被使用，这很重要，因为这就是runtime 而且这个runtime，已经为无处不在的 NVIDIA AI Platform 做了完整优化，所以你可以在任何Cloud 本地部署环境，甚至设备端运行 OpenShell 现在你有了工具和Library Agent可以使用它们，你也有了可以修改的模型，或者可以直接使用的模型，你还有agent 这可以是OpenClaw Herms也是另一个非常出色的harness 这些agentic harnesses 现在可以在本地部署，也可以在任何地方为你运行，所以一共四样东西，它们代表了现代企业的操作系统，那我们怎么使用它，我最喜欢的agent 用力之一是芯片设计师，这是NVIDIA做的最重要的一件事，所以我们当然要和Cadence合作，打造Super Agent，也就是芯片设计Super Agent 它由Codex或Claude Code来编排它的输入，包括RTL、架构图、原理图、规格说明，或者任何你需要修复的东西，我们一起打造了一些Super 智能体他们用Nemotron 针对NVIDIA Runtime做了优化，我们来看一下，真的非常厉害 Cadence和NVIDIA正在合作，构建芯片设计 Agent数十万颗NVIDIA芯片，组合在一起，构成AI Factories 为全球最前沿的AI模型，提供动力，设计这些芯片，以及它们运行所在的系统，是最困难的工程挑战之一，万亿级晶体管三维电路，微观尺度，每一个gate 每一根wire 都要同步到匹秒级，而且必须完美协同，不能有任何出错空间，物理原型太慢，也太昂贵，所以工程师在数字世界里工作，每一颗芯片，一开始都是一组架构，规格说明，然后被转换成RTL 也就是芯片设计的语言 RTL必须在仿真中得到验证，一个bug就可能让一颗芯片延迟数月，在NVIDIA数千名工程师，每年消耗数十亿小时的compute 数百万个测试，被编写运行和调试，这个周期，通常需要团队花上数周时间，为了压缩这个周期 Cadence和NVIDIA 构建了一个设计验证系统 Agent Codex负责编排整个流程 Cadence Chip Stack 启动RTL验证循环，由Nemotron提供动力，并由NVIDIA OpenShell保护，它会调用专门的Subagents 分别负责RTL生成Test Bench 创建Regression Testing和Debug [00:59:53]

Vera Rubin 与 N1X 芯片

黄仁勋：创建Regression Testing和Debug 这个系统可以自己驱动自己 Chip Stack 智能体会用Cadence Accelium 跑数百次仿真，用Jasper做形式验证 Design Formal会揭示代码里的Bug 并修复它们，过去需要数周的工作，现在只需要数小时，验证周期快了40多倍 NVIDIA和Cadence 正在一起用AI 智能体重新发明芯片设计，从数周到数小时，从数周到数小时，从数周到数小时 NVIDIA有数千名芯片设计师，我们会雇用数十万个Cadence Super 智能体和我们一起工作，这样我们就能加速整个公司，这样我们就能更有雄心，创造出更多了不起的东西，跑得更快，你们刚才已经看到了这套Toolkit 里面有Models, Harness和Tools 在这个案例里 Tools就是Cadence the Simulator's Verifiers 以及Formal Verification Systems 这就是为什么我们要和Cadence深度合作，把他们所有工具都用COEA加速，因为agent没有耐心 agent想马上拿到答案，所以模型 harness 加速的CTA 加速库和工具，再加上rhyme time 你们刚才看到的就是，这些全部结合在一起，这一切首先需要一个优秀的模型 cadence可以修改和调优这个模型，让他精通cadence的工作流，精通cadence的专业知识，这样他们就能用自己的专有知识，创建属于Cadence的专有超级Agent 他们必须从一个优秀模型开始，我们叫它Nemotron NVIDIA致力于为全世界构建开放模型，让你们所有人，也让我们所有人都能创建自己的Agent 今天我们发布Nemotron 3 Ultra 我们的下一代开放模型，它非常聪明 Nemotron模型不只是把模型给你，我们还把训练这个模型用到的全部数据都给你，因为我们有一批非常出色的合作伙伴，你们可以在下面看到所有合作伙伴，我们一起合作互相贡献数据，有了这些优秀的合作关系 Nemotron是用全球最大规模之一的，长程推理模型数据集训练出来的，也包含长程工具使用，和任务求解的数据集，从模型训练脚本到数据，所有这些都会完整提供给你们，这就是开放模型最好的样子，也是全世界最好的，开放模型体系和政策，目标很简单，就是让你能拿走，全部内容在上面，继续添加，让它变得更好，让它成为你自己的东西 Nemotron 3 Ultra的速度快了五倍，这是全球第一个基于混合架构的模型，把SSM也就是State Space Models 和Mixture of Experts结合在一起，这个架构非常快，我们把它做快是为了让你思考得更快，当你思考得更快，在同样成本下，你就能思考得更久，所以它快了五倍，它的成本也低了30% 无论按总Falps还是按总推理时间来算，运行成本都比全球最具成本效益的模型，还要低30% 我们对比的是全球最好的开放模型，前沿级智能速度快5倍，成本低30% 而且完全开放，我们会坚定地投入这件事，这是Nemotron 3 我们现在已经在做Nemotron 4 所以从模型 Harness 工具，技能，到Ryme Time 这整套工具链，就是为什么今天，全球每一家企业，都有能力创建自己的agent 就像Cadence 用他们的超级agent 做到的那样，我们正在和很多公司合作，包括Cadence Crowed Strike，The SO Palantir SFP 和ServiceNow 人们总是对我说 Jensen agent会颠覆这些市场，我说恰恰相反，现在你们可以看到了 Agent会为我的合作伙伴和朋友们，创造有史以来最大的机会，我们还有Nemo 也就是NVIDIA面向企业AI的 Agentic Toolkit 来帮助他们就是这样，第一 Vera Rubin已经全面量产，第二 Vera CPU 这是为新一代Agent打造的CPU 第三 NVIDIA的企业AI工具包，让每一家企业，每一家企业软件公司，都能构建agent 我和各位的关系，是从这里开始的，也一路走到今天，在座很多人，我在台湾的很多朋友和合作伙伴，你们的公司也是从这里开始的，从很多意义上说，这里就是现代计算机产业的起点，到现在已经40年了 NVIDIA已经33岁了 PC产业当时已经开始成型，有Windows 1 Windows 2 也有Apple 1 Apple 2 到我们出现的时候 Windows 3.1已经成为PC的代表，你们也知道 Windows 95 让PC真正变成个人电脑，它把PC从企业和公司里带出来，变成了一种消费电子设备，每个人都应该拥有一台，而后来每个人也确实都有了，这就是起点，这个计算平台做了几件非常聪明的事，你们知道 Windows不只是被拆分开来，它也被正确地抽象出来，它的架构设计得刚刚好，系统BOS 开放芯片组，带驱动的操作系统，驱动可以在Runtime连接和安装，还有一个带多媒体API的抽象层，正是这些，把PC打开，变成了我们今天熟悉的样子，每一个要素都对PC后来的普及至关重要 40年后 Microsoft和NVIDIA要重新发明PC 这将会成为新的PC 明天晚上应该是按我们这里的时间，明天晚上我会和Satya一起，更多地谈谈Microsoft和NVIDIA 过去三年一起做的工作，我们花了这么长时间，才彻底重新思考PC应该怎样工作，好，让我们为这个时刻做好准备，就像我前面提到的，那种叫做agent的计算模式，会运行在AI云里，会运行在企业内部，它也会运行在你的PC上，当PC里有了autonomous agent 会发生什么，一个能帮助你理解你的agent 你可以跟他说话，他可以看着你，你可以让他读取文件，帮你做一些研究，它还能做更多事，等一下我会展示给你们看，新的操作系统，当然就是旧的操作系统，加上Large Language Model 从很多方面看 Large Language Model 就是现代版的DirectX 它有输入和输出，能理解Prompt 能理解Computer Vision 它可以生成视频，也可以生成声音，它是PC的现代扩展，是计算机的智能扩展，在这之上，正如我之前说的，应用程序会被一个Agentic Runtime取代，这就是现代应用，也就是Agent 现在我们来看一下它能做什么，一切始于一个火花，一个想法，在40年来第一次，为AI时代重新想象PC 在Agent的世界里，我们的个人电脑会变成什么 Agent 原生运行，连接本地或云端的模型，成为个人AI 他们为了安全被Sandbox隔离，持续运行，把工作完成，芯片和操作系统都必须进化，介绍RTX Spark 我们33年来学到的一切，都浓缩进了一颗芯片 Blackwell RTX GPU 拥有6144个CUDA Core 它有一个Peta-Ethylope的AI性能，一个定制的20-core-grade CPU 由我们和MediaTek合作打造，并通过NV-Link融合在一起，128GB Unified Memory TSMC 3nm工艺700亿个晶体管，并且我们和Microsoft紧密合作，打造了一个面向agent的Windows平台，我们正在重新发明个人电脑，为创作为游戏也为agent 这是新一轮个人计算革命的黎明，而它从NVIDIA RTX Spark开始，它就在这里，当然，我得给你们看最漂亮的部分，也就是电子游戏，这也是最贴近我们内心的部分，这是Forza 顺便说一句，这是007 新款007游戏，我很期待玩它，我看起来有点像它女士们，先生们 NVIDIA RTX Spark 笔记本电脑来了，谢谢，我口袋里的东西太多了，好了，这是全世界造出来过的，最惊人的芯片，这是我们和MediaTek 合作打造的N1X 我想我刚才看到了Rick [01:09:50]

三类 Windows 机器与机器人

黄仁勋：我想我刚才看到了Rick 这就是N1X 这是一颗非常漂亮的芯片，坦白说，这是一颗需要33年，才能造出来的芯片，原因是 NVIDIA的软件站，百分之百都能在这里运行，如果你想跑Digital Biology 没问题，如果你想做Seismic Processing 没问题，你想做Astrophysics 没问题，所有和CVA有关的东西，所有Physics, Biology, Genomics, AI 都没问题，所有Computer Graphics也没问题 NVIDIA曾经创建过的每一个Application Windows曾经运行过的每一个Application Microsoft和NVIDIA都进行了细致优化，所以这台电脑几乎能运行世界上曾经创造出来的一切，而且现在它还能运行Agent 这是一台不可思议的电脑，我为它感到非常自豪，好现在我希望你们记住这一点，在下一个视频里我要给你们看的是，想象一下这里的一切都将能在你的PC上运行，那台电脑可以有一个，本地的Nemotron 3 Ultra Model 或者Nemotron 3 Super Model 它也可以连接云端的Claude Code Codex 或者云端的其他模型，也可以连接网络上的某个模型，它会运行起来，做出非常了不起的事，我们播放一下，每一栋房子，最开始都是一个想法，从想法走到设计，需要大量工具，专业知识，也需要很多时间，现在，一个本地运行在RTX Spark上的agent 可以用我笔记本电脑上的工具，帮我设计一栋房子，它在一个OpenShell Sandbox里运行 Herms Harness 并连接云端的Claude Sonnet 我选择场地，分享我的概念，草图，以及用来启发设计风格的Mood Board 然后我给出Prompt 也就是一段文字，描述需求和设计意图，我的agent开始工作，使用我笔记本上的工具，他打开 Rhino 开始对场地建模塑造地形，退界和建筑体量边界，然后他提出针对成本舒适度，和质量优化过的建筑形体，形体确定之后，我的agent会生成室内布局，墙体洞线和房间开始成型，只要我想调整，想修改，我随时可以介入，门窗和结构元素会自动放置，我的agent会发现自己的错误，并把它们修正，当我批准之后 agent会把模型从rhino 导出到blender材质，和对象属性会一起转过去，设计上下文也会完整保留，我微调材质，把视觉效果调到正好，然后我选择镜头blender 渲染这栋房子，我的agent使用generative AI和flux R model 让画面变得照片级真实，它可以生成多个视角，多种光照条件，过去很复杂的workflow 现在由我的agent引导并简化，它和我一起在RTX Spark上工作，让设计达到想象的速度 PC和agent的世界开发者，对此非常兴奋，这是一台不可思议的电脑，它有完整的加速能力，也有配套的软件能力，我们正在和每一位开发者合作，让它成为一台真正适合大家的出色电脑，接下来是Adobe Adobe当然有一整套非常强大的工具，全世界有数千万人在使用，他们重新设计了Adobe核心架构，包括Photoshop和Premiere 并且会为RTX Spark发布，它的速度会快一倍，现在已经很快了，接下来还会再快一倍，而且它也被设计成，对agent友好，通过它的MCP server 现在可以和你笔记本上的agent交互，有这么多客户，这么多合作伙伴，都非常兴奋地，要把RTX Spark推向市场，这真的太不可思议了，这是40年来 PC产品线第一次被重新发明，我非常高兴，你们所有人，以及全球生态系统，都加入了我们，这基本上就是所有人，所有人都会支持RTX Spark 并且会和我们一起打造，非常智能强大，漂亮的笔记本电脑，非常感谢，但还不止这些，还不止这些 RTX Spark 是对笔记本电脑的重新发明，但事实上 Microsoft和NVIDIA 正在重新发明整个PC 今天我们发布一个全新的产品线，三类革命性的Windows机器，覆盖台式机、笔记本和工作站，它们百分之百兼容Windows 百分之百支持CUA 百分之百支持NVIDIA AI Tensor，你看到的所有能在NVIDIA 以及全球各种平台上运行的东西，都能在这里运行，这是40年来第一条，被彻底重新设计，重新发明的PC产品线，真正了不起的是，这个，这是RTX Spark笔记本，这是台式机，这台来自MSI Joseph 这台是你的，看看它多漂亮 Agent可以24小时，一周7天运行，不用担心电池，你可以下载你的Agent 也可以在这里培养你的Agent 这就是你自己的云，它一直在运行，不用担心电量，而且它就放在这里，连接你的整个家，它连接你的笔记本，连接你的显示器，连接所有摄像头，连接你的烘干机，饮水机，热水器，连接你想连接的一切，也包括你的安防系统，这一切都连到它上面，它就成了你的个人AI 你的个人AI Agent 它会随着时间变得越来越聪明，因为今天我们有Nemotron 3 Ultra 明天会有Nemotron 4 然后是Nemotron 5 Nemotron 6 我们会让它越来越聪明，与此同时，它就放在你家里帮你做事情，你想订旅行，没问题，如果你想要一套非常强大的系统，这是一台DGX Station 兼容Windows 能运行Windows上的一切，它有768GB内存，所以你可以运行一万亿参数模型，这太不可思议了 20PTF 内存带宽每秒8TB 它就放在你的桌边，如果你是大语言模型开发者，或者是agent开发者，把这台机器放在桌边，就能给你所需的全部算力，等你要部署时，再把它放到云端，如果你看着这些东西，仔细想一想，就会发现这里正在发生一些变化，还记得15年20年前，我们有一个东西叫电话，今天我们有一个东西叫PC 现在当你想到手机时，有一件事你几乎不会用它来做，那就是打电话，你会用它做几乎所有其他事情，所以今天的手机对你来说，已经和过去的电话完全不是一回事，我很确定，接下来PC也会发生同样的事，十年后的PC和你今天理解的PC 也就是一个用来打开应用，点击打字的工具，会完全不一样，我的想法是这样，我完全可以想象，就像今天每个家庭都有家庭影院，很多家庭有家庭影院，大电视割草机洗碗机一样，我也完全可以想象，未来某一天，你家里真的会有一台 AI超级计算机，它运行你所有的agent 运行你所有的助手，他们会一直为你做各种各样的事情，你会需要把它放在家里，就像你家里有家庭，影院，有音响，有游戏主机一样，你会在家里运行 AI agent计算机，随着时间推移，这些设备对你来说，会越来越像RD 越来越像CCPO 而不是像一台PC 毫无疑问，这次对计算机的重新发明，重要性不亚于当年，把电话重新发明成，我们今天所说的智能手机，所以这是这段旅程的开始，这是一条新产品线的开始，我们已经为它制定了路线图，这是我们一个全新的产品家族，每一代架构，我们都会有台式机笔记本工作站，然后下一代还是台式机笔记本工作站，最让我无比高兴，无比荣幸的是，全球百分之百的PC行业，都加入了我们，一起来重新发明PC 一条新的产品线，一个新的开始，谢谢，大家知道 Agentic AI 本质上就是数字机器人，它能理解，推理，规划，行动，还会使用工具，Agentic AI会运行在所有这些计算机上，过去这些年，你们也听我逐一讲过它们，我们在做人形机器人计算机，也在做各种机器人计算机 [01:19:47]

物理 AI 与多终端平台

黄仁勋：也在做各种机器人计算机，我们在做自动驾驶汽车计算机，也在做卫星，你们有GeForce 里面有TESAR Cores 我刚刚还讲了一整条新的PC产品线，农业设备制造设备，重工业设备都会变成Agentic 你甚至会有一个小小的Agentic AI助手，专门帮你做事，甚至你的基站，也就是未来的无线电站，都会变成Agentic 他们会理解流量，思考，怎样和其他基站协同，让能耗尽可能低，同时提升利用率和频谱效率，所以一切都会运行Agent 今天NVIDIA大体上还处在中心位置，但我非常确定，未来全世界会有数百亿，甚至数千亿个Agentic系统，Agentic计算机在运行，最大的问题是数据，对语言模型来说，我们在互联网上用来训练的英文和各种语言，都是从人的视角产生的，是我们写出来，也是我们在阅读，但是要为AI机器人创建数据，数据就必须来自机器人的感知，来自机器人的视角，而世界上绝大多数视频数据，都是第三人称视角，不是第一人称视角，所以对agentic系统，机器人系统 physical AI来说，数据是最难的问题，你们也看到了，我们一直在沿着这条阶梯往上走，我们从Teleoperation开始，也就是人类示范，这和Reinforcement Learning Human Feedback，带来的重大突破没有区别，接着我们使用Simulation 这就是Omniverse发挥作用的地方，这和Reinforcement Learning也没有区别，只不过奖励是可验证的，所以我们用这些系统来启动AI Model 也就是Physical AI Model 最终我们能够从第三人称数据中学习，把它重新投射到第一人称视角里，现在通过这种bootstrapping 我们有了一个World Foundation Model 它可以从你想要的任何视角，理解物理世界，第三人称，第一人称，从外到内，从内到外都可以，这确实是一个重大突破，今天我们发布NVIDIA Cosmos 3 Cosmos 3是Physical AI的前沿模型，在语言模型上，我们已经站在前沿，有非常多人在做这件事，但是在Physical AI上，我们绝对是全世界最强的，我为团队做到这一点，感到非常自豪，这会成为你们所有工作的 Foundation Model 不管你想造一个机器人，还是想造一个工厂机器人，或者一个在工厂里工作的机器人，只要是任何涉及物理世界的机器人，现在你都有了一个伙伴 Cosmos 3 它能够理解和推理，能够生成，也能够在闭环中做simulation 它甚至可以直接成为policy本身，它在世界各地的排行榜上都名列前茅，我为Cosmos感到无比自豪，今天我们发布Cosmos 3 我们来看一下，真实世界是无限的，也是不可预测的 Physical AI需要数据，但真实世界的数据，不可能无限扩展，对Physical AI来说 Compute就是数据，这就是Cosmos 一个面向Physical AI的开放 Frontier Omni Model 它基于一种新的 Mixer of Transformers 架构、构建、像素、动作、声音和语言，会流入autoregressive transformer 它负责推理、规划，并指示diffusion transformer 生成接下来会发生什么，开发者可以针对不同embedment和使用场景，对Cosmos做post-train 作为VLM Cosmos会观察物理世界理解，正在发生什么描述场景，并标记重要内容，作为world model Cosmos可以根据图像、文本或视频，生成符合物理规律的合成视频，作为simulator Cosmos可以为policy training和evaluation 闭合循环，作为NVIDIA Omnidreams的基础，也就是一个以动作为条件的world model Cosmos会逐帧预测未来，对Cosmos做post-training之后，它就会变成一个world action model 它能够感知推理规划，并为各种机器人生成动作，为所有会移动的东西，提供一种新的数据，一种新的老师，这一切都有compute生成，也就是cosmos 它是physical AI时代开发者的基础，数据加上compute会得到AI 现在我们已经有了AI compute就是数据，所以使用cosmos 3去训练大量AI model，Cosmos是一个非常出色的开放模型系统，它和Nemotron完全一样，我们开放model 开放数据，甚至开放我们训练它的方法，这样你们就能自己增强它，把Cosmos变成你们自己的proprietary model 我们有非常出色的合作伙伴，正在和我们一起服务许多不同的行业，当然 model本身是AI stack里最容易理解的部分，但AI stack非常复杂，里面有generators models simulators 和runtime 就像agentic systems一样，这些汽车本质上就是physical AI 是一种agentic robot 也就是autonomous vehicle 它同样有一套复杂的stack 今天我们发布Alpamayo-R1 这是一个面向自动驾驶汽车的开放模型，我们正在和全球各地的汽车公司合作，你们看这些已经加入NVIDIA Hyperion 正在打造NVIDIA Hyperion汽车的品牌，他们大约代表了全球80%的汽车产量，也就是说，这些制造商代表了全球80%的汽车，接下来会有大量NVIDIA Hyperion系统，能够运行Alpamayo-R1 或者任何其他人的AV Stack 我们也已经接入出行服务，全球大约97%的出行服务，都在和我们连接，这样当我们把Alpamayo 部署到Hyperion Runtime 并配合Halos操作系统时，就能连接到全球这些服务，我们来看一下，这是全球第一辆，具备推理能力的自动驾驶汽车，如果你让它一直说话，它会把你逼疯，但我们很高兴，它一直在自己跟自己说话，那就叫思考，所以Alpamayo-R1 R1 是一辆会推理的汽车，我们创造的这项技术，也适用于人形机器人，当然还需要出现很多新的突破 NVIDIA Isaac GR00T 是我们的人形机器人stack 包括模型数据，生成，仿真 Running time 也包括操作系统，这就是GR00T平台，也就是Isaac GR00T平台，你们可以看到，我们每一个系统，都是完全相同的模式，无论是云端的Agentic系统 PC上的Agentic系统，自动驾驶汽车的机器人系统，还是人形机器人的机器人系统，都是一样的，当然在每一种情况下，我们都会把所有东西完整做出来，我们做垂直整合，做完整集成，做协同设计，而且是极致协同设计，然后再开放给所有人使用，你喜欢哪一部分，想用什么都可以用，我们甚至还会帮你修改，但现在缺少的一件事是，机器人系统需要一个参考平台，这些机器人系统太复杂了，有这么多电机，这么多传感器，又这么脆弱，但我们需要一种方式，把这些参考平台交付出去，就像我们在PC DGX 云和自动驾驶汽车上做的那样，现在我们也要为机器人这么做，今天我们发布 NVIDIA Isaac GR00T 一个参考人形机器人，它是完整集成的，每只手有25个自由度，由Shadow制造，机器人本体有31个自由度，身高6英尺，体重150磅，跟我一样，第一个数字比我高，第二个数字比我大，其他方面就很接近了，这个平台运行新的Thor 也运行我们的整套软件Stack 数据生成Stack 数据仿真Stack runtime 全部集成到一个机器人里，这个机器人就是为所有人使用而设计的，我们是为高等教育和大学研究人员打造它的，因为让他们自己从头做，这个难度实在太高，我们来看一下 AI的下一次跃迁是通用机器人，是人形机器人，但做出一个人形机器人很难，每个团队都要从零开始，把仿真器 Teleop系统，数据Pipeline 和训练基础设施拼在一起 [01:29:52]

Isaac GR00T 开放平台

黄仁勋：和训练基础设施拼在一起，研究真正开始之前，光搭建环境就要花几个月 NVIDIA Isaac GR00T 是一个面向人形机器人的开放，开发平台，它包括开放模型，仿真和训练库数据生成器，再加上机器人计算机，整套Pipeline都已经打通几个小时内，就能准备好，首先在Isaac Lab里搭建仿真环境，然后用Isaac Teleop 在真实机器人或仿真机器人上，采集示范数据，再用Omniverse和Cosmos生成合成数据，把一次示范扩展成成千上万次，用来训练策略，在Isaac Lab里，评估这些策略，然后通过运行在 Jason Thor上的Isaac ORS 部署出去，每一个组成部分，都是模块化开放的，你可以用我们的，也可以换成你自己的GR00T 在各个学科，各个领域的机器人研究，提供动力，从研究实验室到工厂车间，都是如此，一个开放平台，现在还有一个新版本 Isaac GR00T参考设计机器人，基于NVIDIA的开放平台打造，它已经为前沿研究准备好了，任何地方的任何实验室都可以使用，机器人时代，从这里开始 NVIDIA Isaac GR00T 机器人太多了，我们正在和世界上，几乎所有做机器人，或者做机器人系统的人合作，我再把刚才说的总结一下，过去六个月，计算机行业已经被彻底改变了，一切都变了，一切都变了，是因为Agent真正出现了，而且它和最新的前沿模型，汇合在一起，让AI现在能够做有用的工作，这种计算模式，会一遍又一遍地重复出现，这种Agent的计算模式，就是一个模型，一个Harness 它使用工具具备技能，并且运行在一个runtime里 runtime取决于它是在云端 On-Prem PC上，还是在机器人里，但它们的计算模式完全一样，你会根据自己的偏好，使用不同的Harness 你会根据自己的偏好，使用不同的模型，你会为了自己的专有用途，去改进它们，你还会创建Super Agent 把它租给别人，帮助它们完成工作 Agentic平台，这种agentic模式 NVIDIA 有一套企业 AI toolkit 对你们所有人来说，这是接入和使用自己AI的好方式，对我们来说，这也是一个很好的增长机会 Vera Rubin已经全面量产 Grace Blackwell 是为处理AI而打造的，尤其是推理，而Vera Rubin是为运行agent而打造的，它已经全面量产，它远远不只是一个GPU 它是一整套解耦式分布式的agent处理系统 NVIDIA真的已经变成了一家基础设施公司，不只是GPU公司，也不只是系统公司，而是一家基础设施公司，我们要帮助你们创造最大的收入，最大的利润，并且尽快达到这个目标，在agent的世界里，这是一种新的计算方式，现在你们构建CPU 是为Agent构建，不是为人构建，面向Agent的CPU 有它自己的特殊要求，而我们的NVIDIA Vera 是革命性的，我对它的量产爬坡非常高兴，现在的订单规模，已经会让它成为我们公司历史上，最快也最成功的一次产品发布 NVIDIA和Microsoft 已经打造出了一整条，全新的PC产品线，这是一个新的开始，当然，我刚才描述的同样的 Agentic处理模式，计算模式，也会运行在各种各样的设备上，我提到了PC 但未来它会运行在机器人，卫星，基站，工厂里，也会运行在云端，本地和边缘端，这种Agentic AI系统，这种Agentic计算模式，会在各类计算机中不断复制，我们对个人电脑的理解，很可能也会改变，我要感谢你们所有人的合作和友谊，没有我们一起做的，这一切我们不可能走到今天，我为你们在过去一年取得的成功，感到非常自豪，明年还会更多，我还有一件事要给你们看，我们来看一下，祝大家Computex过得愉快，感谢这精彩的一年，谢谢你们的友谊和支持，谢谢，保重，祝大家Computex过得愉快 [01:34:27]

返回该播客打开原文