黄仁勋（NVIDIA CEO）：AI工厂、推理拐点与万亿美元需求

撰文：Techub News 整理

在NVIDIA GTC 2026长达两个多小时的主题演讲中，创始人兼CEO黄仁勋（Jensen Huang）描绘了一幅波澜壮阔的AI未来图景。他不仅回顾了CUDA诞生20年来的生态飞轮，更重磅预测了未来几年高达万亿美元的AI计算需求，并宣告了从“数据中心”到“AI工厂”、从“检索式计算”到“生成式计算”的范式革命。本次演讲信息量巨大，涵盖了从芯片架构、系统设计、软件生态到行业应用的完整价值链，是理解NVIDIA战略与AI产业趋势的关键窗口。

从CUDA飞轮到AI工厂：计算范式的根本转变

黄仁勋开篇即强调了CUDA平台20年积累的“安装基数”魔力。他指出，正是全球部署的数亿个CUDA GPU构成了NVIDIA最深的护城河，吸引了开发者，催生了如深度学习般的突破性算法，进而开拓了新市场，形成了如今加速旋转的“飞轮”。这个飞轮不仅让NVIDIA的计算平台能够承载海量应用，更关键的是，它赋予了基础设施超长的“有用生命周期”——因为CUDA支持AI生命周期的每一个阶段，从数据处理到科学计算，应用范围极广，使得GPU的长期投资回报率极高。

然而，真正的变革在于计算目的的转变。黄仁勋提出了一个核心观点：未来的数据中心不再是“存储和处理数据的地方”，而是“生产智能的工厂”。其产品是“Token”（令牌/推理结果），其营收直接与Token的产量挂钩。他引用了行业分析机构SemiAnalysis的报告，指出衡量一个AI工厂效能的关键指标是“每瓦特Token数”和“每次推理的智能度”。前者决定了在固定的电力预算下工厂的“产能”，后者则关联到AI的“智能水平”。

“这是一个全新的视角，”黄仁勋解释道，“每个CEO未来都需要从这个角度审视他们的业务。因为你的AI工厂（数据中心）在物理上受限于土地、电力和建筑。一旦建成，其功率上限就固定了。你必须确保，在这个功率限制内，你的推理架构是高度优化的，因为Token就是你的新商品，计算能力直接等同于你的收入。”

他进一步指出，过去两年，AI领域发生了根本性转折。从ChatGPT开启生成式AI时代，到OpenAI的O1/O3模型展现“推理”能力，再到Claude Code等“代理型AI”（Agentic AI）能够实际“执行任务”，AI从“感知理解”走向了“生成”，再进化到“推理”，最终成为能“干活”的生产力工具。每一次进化都伴随着对计算需求的指数级增长。“推理拐点已经到来，”黄仁勋断言，“AI现在要思考、要行动、要阅读，所有这些都需要推理（Inference），需要生成Token。这远远超越了训练阶段。”

他给出了一个震撼的数字：基于推理工作负载计算需求的万倍增长和实际使用量的百倍增长，过去两年AI对计算的总需求增长了一百万倍。正是基于这种判断，他透露，目前NVIDIA看到的 Blackwell 和 Rubin 平台订单需求，从去年GTC时预测到2026年的5000亿美元，已激增至2027年的至少1万亿美元。“我确信实际的计算需求会远高于此。”他补充道。

垂直整合与水平开放：NVIDIA的全栈战略

面对如此巨大的需求和复杂的应用场景，黄仁勋阐述了NVIDIA独特的战略定位：“全球首家垂直整合但水平开放的公司”。他认为，加速计算本质上不是芯片或系统问题，而是“应用加速”问题。在摩尔定律失效后，要继续实现性能的巨幅提升和成本的大幅下降，唯一途径就是针对特定领域进行加速。

“这就是为什么NVIDIA必须一个领域接一个领域、一个垂直行业接一个垂直行业地深入，”他说，“我们是一家垂直整合的计算公司。我们必须理解应用、理解领域、从根本上理解算法，并弄清楚如何在任何场景（数据中心、云、边缘、机器人系统）中部署这些算法。”为此，NVIDIA构建了覆盖从芯片、系统到库、框架乃至应用模型的完整技术栈。

但垂直整合并非封闭。黄仁勋强调，NVIDIA的成功同样依赖于“水平开放”——将其技术集成到全球任何合作伙伴的平台中。“我们提供软件和库，与你们的技术集成，从而将加速计算带给全世界的每一个人。”他展示了与IBM、戴尔、谷歌云、AWS、微软Azure、甲骨文等几乎所有主流云和数据平台厂商的深度合作案例。例如，NVIDIA的cuDF库加速了IBM Watsonx.data的SQL引擎，使雀巢的供应链数据刷新速度提升5倍，成本降低83%；与谷歌云合作，为Snapchat降低了近80%的计算成本。

这种“垂直整合+水平开放”的模式，使得NVIDIA能够将其在AI计算领域的极致优化能力，通过庞大的生态网络输送到每一个角落。黄仁勋特别提到，NVIDIA业务的60%来自超大规模云厂商（包括其内部AI消费），另外40%则遍布区域云、主权云、企业、工业、机器人、边缘等各个领域。“AI的多样性就是其韧性所在，”他指出，“这不是单一应用的技术，而是一个全新的基础计算平台。”

OpenClaw：引爆“代理操作系统”革命

演讲中，黄仁勋花了相当篇幅讨论一个开源项目：OpenClaw。他将其重要性提升到与Linux、HTML、Kubernetes同等的历史地位。“OpenClaw本质上开源了‘代理操作系统’，”他兴奋地表示，“就像Windows让我们能够创建个人电脑一样，OpenClaw让我们能够创建‘个人代理’。”

他详细描述了OpenClaw的能力：它是一个生成式系统，可以连接并调用大语言模型；管理资源、访问工具和文件系统；进行任务调度和定时作业；能将一个复杂的用户指令分解为一步步可执行的子任务；可以生成并调用其他子代理；并支持多模态交互。“每个公司现在都需要一个开源战略，一个代理系统战略，”黄仁勋断言，“这就是新的计算机。”

然而，企业级部署面临巨大安全挑战。代理在企业网络内可以访问敏感信息、执行代码并与外部通信。“这显然是不能被允许的，”黄仁勋承认。为此，NVIDIA与OpenClaw创始人Peter Steinberger合作，推出了“NVIDIA OpenClaw参考设计”——Nemo Claw。它集成了名为“Open Shell”的安全技术，包含策略引擎、网络护栏和隐私路由器，确保代理能在企业内部安全、合规地运行。

黄仁勋预测，这一变革将重塑整个企业软件行业。“未来，每一家SaaS公司都将成为AgaaS（代理即服务）公司。”企业的IT架构将从围绕“文件和数据”转向围绕“代理和Token”。他甚至设想，未来工程师的薪酬包中将包含“年度Token预算”，以放大其生产力。“Token将成为硅谷招聘的新工具。”而生产这些Token的，正是由NVIDIA与合作伙伴共同构建的“AI工厂”。

物理AI与机器人：智能的具身化

除了数字世界的代理，黄仁勋同样重视物理世界的智能体——机器人。他宣布，NVIDIA的机器人生态系统已汇集了几乎所有主流厂商，本次GTC有110台机器人参展。NVIDIA为此提供三套核心计算系统：训练计算机、合成数据生成与模拟计算机，以及机器人本体内的边缘计算机。

在自动驾驶领域，黄仁勋宣布了“ChatGPT时刻”的到来。“我们现在知道，可以成功地让汽车自动驾驶。”他宣布比亚迪、现代、日产、吉利四家新合作伙伴加入NVIDIA的“Robotaxi就绪平台”，这些车企年产量总计达1800万辆。此外，NVIDIA还与Uber达成合作，将在多个城市部署Robotaxi网络。

更令人印象深刻的是与迪士尼的联动。黄仁勋在现场与搭载了NVIDIA Jetson芯片、在Omniverse中通过牛顿物理求解器学习行走的“雪宝”（Olaf）机器人进行了互动。这展示了NVIDIA Isaac Lab机器人训练平台、Cosmos世界模型和GR00T机器人基础模型在创造拟人化、能适应物理环境的机器人方面的强大能力。

黄仁勋总结道，NVIDIA正通过其开放模型计划，在AI的每一个前沿领域提供顶级模型：用于语言的Nemotron、用于物理世界理解的Cosmos、用于自动驾驶的Alpamayo、用于通用机器人的GR00T、用于生物学的BioNeMo以及用于气候预测的Earth-2。他宣布成立“Nemotron联盟”，联合Black Forest Labs、Cursor、LangChain、Mistral、Perplexity、Sarvam等顶尖AI公司，共同推进下一代大语言模型的开发。

“我们正处于一场复兴之中，一场企业的复兴，”黄仁勋在演讲尾声说道，“这是一个从2万亿美元的产业迈向数万亿美元产业的转折点。未来提供的将不仅仅是供人使用的工具，更是我们擅长的专业领域中专用的、可以‘租用’的代理。”在他的展望中，由AI工厂生产的Token，将成为驱动未来数字经济和实体经济的核心能源，而NVIDIA构建的全栈计算平台，正是这座宏大未来的基石。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

黄仁勋（NVIDIA CEO）：AI工厂、推理拐点与万亿美元需求

从CUDA飞轮到AI工厂：计算范式的根本转变

垂直整合与水平开放：NVIDIA的全栈战略

OpenClaw：引爆“代理操作系统”革命

物理AI与机器人：智能的具身化

Techub News的精选文章

目录

相关文章