黄仁勋(NVIDIA CEO):AI工厂、推理拐点与万亿美元需求

CN
11小时前

撰文:Techub News 整理

在NVIDIA GTC 2026长达两个多小时的主题演讲中,创始人兼CEO黄仁勋(Jensen Huang)描绘了一幅波澜壮阔的AI未来图景。他不仅回顾了CUDA诞生20年来的生态飞轮,更重磅预测了未来几年高达万亿美元的AI计算需求,并宣告了从“数据中心”到“AI工厂”、从“检索式计算”到“生成式计算”的范式革命。本次演讲信息量巨大,涵盖了从芯片架构、系统设计、软件生态到行业应用的完整价值链,是理解NVIDIA战略与AI产业趋势的关键窗口。

从CUDA飞轮到AI工厂:计算范式的根本转变

黄仁勋开篇即强调了CUDA平台20年积累的“安装基数”魔力。他指出,正是全球部署的数亿个CUDA GPU构成了NVIDIA最深的护城河,吸引了开发者,催生了如深度学习般的突破性算法,进而开拓了新市场,形成了如今加速旋转的“飞轮”。这个飞轮不仅让NVIDIA的计算平台能够承载海量应用,更关键的是,它赋予了基础设施超长的“有用生命周期”——因为CUDA支持AI生命周期的每一个阶段,从数据处理到科学计算,应用范围极广,使得GPU的长期投资回报率极高。

然而,真正的变革在于计算目的的转变。黄仁勋提出了一个核心观点:未来的数据中心不再是“存储和处理数据的地方”,而是“生产智能的工厂”。其产品是“Token”(令牌/推理结果),其营收直接与Token的产量挂钩。他引用了行业分析机构SemiAnalysis的报告,指出衡量一个AI工厂效能的关键指标是“每瓦特Token数”和“每次推理的智能度”。前者决定了在固定的电力预算下工厂的“产能”,后者则关联到AI的“智能水平”。

“这是一个全新的视角,”黄仁勋解释道,“每个CEO未来都需要从这个角度审视他们的业务。因为你的AI工厂(数据中心)在物理上受限于土地、电力和建筑。一旦建成,其功率上限就固定了。你必须确保,在这个功率限制内,你的推理架构是高度优化的,因为Token就是你的新商品,计算能力直接等同于你的收入。”

他进一步指出,过去两年,AI领域发生了根本性转折。从ChatGPT开启生成式AI时代,到OpenAI的O1/O3模型展现“推理”能力,再到Claude Code等“代理型AI”(Agentic AI)能够实际“执行任务”,AI从“感知理解”走向了“生成”,再进化到“推理”,最终成为能“干活”的生产力工具。每一次进化都伴随着对计算需求的指数级增长。“推理拐点已经到来,”黄仁勋断言,“AI现在要思考、要行动、要阅读,所有这些都需要推理(Inference),需要生成Token。这远远超越了训练阶段。”

他给出了一个震撼的数字:基于推理工作负载计算需求的万倍增长和实际使用量的百倍增长,过去两年AI对计算的总需求增长了一百万倍。正是基于这种判断,他透露,目前NVIDIA看到的 Blackwell 和 Rubin 平台订单需求,从去年GTC时预测到2026年的5000亿美元,已激增至2027年的至少1万亿美元。“我确信实际的计算需求会远高于此。”他补充道。

垂直整合与水平开放:NVIDIA的全栈战略

面对如此巨大的需求和复杂的应用场景,黄仁勋阐述了NVIDIA独特的战略定位:“全球首家垂直整合但水平开放的公司”。他认为,加速计算本质上不是芯片或系统问题,而是“应用加速”问题。在摩尔定律失效后,要继续实现性能的巨幅提升和成本的大幅下降,唯一途径就是针对特定领域进行加速。

“这就是为什么NVIDIA必须一个领域接一个领域、一个垂直行业接一个垂直行业地深入,”他说,“我们是一家垂直整合的计算公司。我们必须理解应用、理解领域、从根本上理解算法,并弄清楚如何在任何场景(数据中心、云、边缘、机器人系统)中部署这些算法。”为此,NVIDIA构建了覆盖从芯片、系统到库、框架乃至应用模型的完整技术栈。

但垂直整合并非封闭。黄仁勋强调,NVIDIA的成功同样依赖于“水平开放”——将其技术集成到全球任何合作伙伴的平台中。“我们提供软件和库,与你们的技术集成,从而将加速计算带给全世界的每一个人。”他展示了与IBM、戴尔、谷歌云、AWS、微软Azure、甲骨文等几乎所有主流云和数据平台厂商的深度合作案例。例如,NVIDIA的cuDF库加速了IBM Watsonx.data的SQL引擎,使雀巢的供应链数据刷新速度提升5倍,成本降低83%;与谷歌云合作,为Snapchat降低了近80%的计算成本。

这种“垂直整合+水平开放”的模式,使得NVIDIA能够将其在AI计算领域的极致优化能力,通过庞大的生态网络输送到每一个角落。黄仁勋特别提到,NVIDIA业务的60%来自超大规模云厂商(包括其内部AI消费),另外40%则遍布区域云、主权云、企业、工业、机器人、边缘等各个领域。“AI的多样性就是其韧性所在,”他指出,“这不是单一应用的技术,而是一个全新的基础计算平台。”

OpenClaw:引爆“代理操作系统”革命

演讲中,黄仁勋花了相当篇幅讨论一个开源项目:OpenClaw。他将其重要性提升到与Linux、HTML、Kubernetes同等的历史地位。“OpenClaw本质上开源了‘代理操作系统’,”他兴奋地表示,“就像Windows让我们能够创建个人电脑一样,OpenClaw让我们能够创建‘个人代理’。”

他详细描述了OpenClaw的能力:它是一个生成式系统,可以连接并调用大语言模型;管理资源、访问工具和文件系统;进行任务调度和定时作业;能将一个复杂的用户指令分解为一步步可执行的子任务;可以生成并调用其他子代理;并支持多模态交互。“每个公司现在都需要一个开源战略,一个代理系统战略,”黄仁勋断言,“这就是新的计算机。”

然而,企业级部署面临巨大安全挑战。代理在企业网络内可以访问敏感信息、执行代码并与外部通信。“这显然是不能被允许的,”黄仁勋承认。为此,NVIDIA与OpenClaw创始人Peter Steinberger合作,推出了“NVIDIA OpenClaw参考设计”——Nemo Claw。它集成了名为“Open Shell”的安全技术,包含策略引擎、网络护栏和隐私路由器,确保代理能在企业内部安全、合规地运行。

黄仁勋预测,这一变革将重塑整个企业软件行业。“未来,每一家SaaS公司都将成为AgaaS(代理即服务)公司。”企业的IT架构将从围绕“文件和数据”转向围绕“代理和Token”。他甚至设想,未来工程师的薪酬包中将包含“年度Token预算”,以放大其生产力。“Token将成为硅谷招聘的新工具。”而生产这些Token的,正是由NVIDIA与合作伙伴共同构建的“AI工厂”。

物理AI与机器人:智能的具身化

除了数字世界的代理,黄仁勋同样重视物理世界的智能体——机器人。他宣布,NVIDIA的机器人生态系统已汇集了几乎所有主流厂商,本次GTC有110台机器人参展。NVIDIA为此提供三套核心计算系统:训练计算机、合成数据生成与模拟计算机,以及机器人本体内的边缘计算机。

在自动驾驶领域,黄仁勋宣布了“ChatGPT时刻”的到来。“我们现在知道,可以成功地让汽车自动驾驶。”他宣布比亚迪、现代、日产、吉利四家新合作伙伴加入NVIDIA的“Robotaxi就绪平台”,这些车企年产量总计达1800万辆。此外,NVIDIA还与Uber达成合作,将在多个城市部署Robotaxi网络。

更令人印象深刻的是与迪士尼的联动。黄仁勋在现场与搭载了NVIDIA Jetson芯片、在Omniverse中通过牛顿物理求解器学习行走的“雪宝”(Olaf)机器人进行了互动。这展示了NVIDIA Isaac Lab机器人训练平台、Cosmos世界模型和GR00T机器人基础模型在创造拟人化、能适应物理环境的机器人方面的强大能力。

黄仁勋总结道,NVIDIA正通过其开放模型计划,在AI的每一个前沿领域提供顶级模型:用于语言的Nemotron、用于物理世界理解的Cosmos、用于自动驾驶的Alpamayo、用于通用机器人的GR00T、用于生物学的BioNeMo以及用于气候预测的Earth-2。他宣布成立“Nemotron联盟”,联合Black Forest Labs、Cursor、LangChain、Mistral、Perplexity、Sarvam等顶尖AI公司,共同推进下一代大语言模型的开发。

“我们正处于一场复兴之中,一场企业的复兴,”黄仁勋在演讲尾声说道,“这是一个从2万亿美元的产业迈向数万亿美元产业的转折点。未来提供的将不仅仅是供人使用的工具,更是我们擅长的专业领域中专用的、可以‘租用’的代理。”在他的展望中,由AI工厂生产的Token,将成为驱动未来数字经济和实体经济的核心能源,而NVIDIA构建的全栈计算平台,正是这座宏大未来的基石。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接