黄仁勋(NVIDIA CEO):AI工厂、智能体革命与万亿级算力未来

CN
16小时前

撰文:Techub News 整理

在NVIDIA年度技术盛会GTC 2026上,创始人兼CEO Jensen Huang(黄仁勋)进行了长达140分钟的主题演讲。这场演讲不仅是对过去一年AI爆炸性增长的总结,更是对未来十年计算范式、基础设施与商业模式的前瞻性宣言。面对全球AI算力需求呈指数级攀升的现实,黄仁勋详细解读了NVIDIA如何通过垂直整合与水平开放的独特战略,构建从芯片、系统、库到应用的全栈平台,以迎接他口中“万亿美金”规模的AI基础设施时代。

CUDA二十年:飞轮加速与垂直整合的胜利

演讲始于一个里程碑——CUDA架构诞生二十周年。黄仁勋强调,CUDA远不止是一个编程模型,它是NVIDIA所有战略的基石。过去二十年,NVIDIA积累了“数亿颗”运行CUDA的GPU所形成的庞大安装基础,这正是其生态飞轮加速旋转的核心动力。

这个飞轮的逻辑是:庞大的安装基础吸引了全球开发者,开发者创造了新算法(如深度学习),算法突破催生了全新市场,新市场又吸引了更多公司加入生态,从而进一步扩大了安装基础。黄仁勋指出,如今NVIDIA库的下载量正以“前所未有的速度”增长,这使得基于CUDA的计算平台能够支撑海量应用与持续突破。

更重要的是,这种广泛的适用性极大地延长了NVIDIA基础设施的“有用寿命”。黄仁勋以六年前发布的Ampere架构为例,指出其在云端的租赁价格不降反升,这正得益于CUDA生态下应用触角的极度延伸。他总结道:“安装基础庞大、飞轮高速运转、开发者触及面广,结合我们持续的软件更新,使得计算成本不断下降。”这种“加速计算”带来的性能跃升与持续的成本优化,构成了NVIDIA架构扩张的核心动态。

黄仁勋将NVIDIA定义为“全球首家垂直整合但水平开放的公司”。他解释,加速计算本质上是“应用加速”。在摩尔定律放缓后,要继续实现巨大的性能提升和成本下降,必须走特定领域加速的道路。这意味着NVIDIA必须深入理解各行各业的应用、算法,并针对从数据中心、云、边缘到机器人系统等不同部署场景进行优化,这就是“垂直整合”。而“水平开放”则体现在NVIDIA将其技术和软件库集成到全球任何合作伙伴的平台中,将加速计算带给全世界。

推理拐点已至:AI工厂与“令牌经济学”

演讲的核心转折点在于对AI发展现状的判断:AI的“推理拐点”已经到来。黄仁勋回顾了过去两年推动行业质变的三波浪潮:ChatGPT开启了生成式AI时代;随后OpenAI o1等模型带来了“推理”能力,使AI能够反思、规划,变得可信且基于事实;紧接着Claude Code等“智能体”模型的出现,使AI能够使用工具、执行任务,从“思考”走向“实干”。

“AI现在必须思考、必须行动、必须阅读、必须推理——每一次都需要进行推理。”黄仁勋说。这导致对计算的需求发生了根本性变化。他给出了一个震撼的数字:过去两年,AI工作负载对算力的需求增长了约“一万倍”,而使用量增长了约“一百倍”,综合起来,他感觉总计算需求增长了“一百万倍”。

这一拐点彻底改变了数据中心的价值定位。黄仁勋提出了“AI工厂”和“令牌(Token)是新时代的商品”这两个关键概念。未来的数据中心不再是存放文件的仓库,而是生产智能令牌的工厂。由于数据中心受电力限制,其核心指标转变为“每瓦特电力产生的令牌数”和“推理速度”(即令牌生成速度)。前者关乎工厂的产出总量,后者则直接影响AI的智能水平(处理更长上下文、更深思熟虑)。

黄仁勋展示了一张被其称为“未来AI工厂最重要图表”的分析图,横轴是令牌速度(智能程度),纵轴是吞吐量(产量)。他以此类比商业定价:低速高吞吐可用于免费服务层;中速中吞吐对应中等价位;高速、能处理百万令牌上下文的高智能模型,则对应高价 premium 服务。他举例,一个研究团队每天使用5000万令牌,若以每百万令牌150美元计,其令牌成本将非常可观。

他宣布,基于Grace Blackwell架构的NVLink 72系统,在关键的高价值服务层级上,实现了比前代Hopper架构高达35倍的吞吐量提升,并将令牌成本降至世界最低。他引用第三方分析称:“即使竞争对手的架构免费,也不够便宜”,因为建造一个千兆瓦级数据中心的固定成本高达约400亿美元,必须填充最高效的计算系统才能实现最优的令牌成本。NVIDIA凭借其“极端代码设计”和全栈优化,在此方面目前“无人能及”。

Vera Rubin平台与智能体操作系统革命

为支撑智能体时代的算力需求,黄仁勋重磅发布了下一代平台——Vera Rubin。这不再是一颗单独的芯片,而是一个垂直整合的巨型系统,包含七种芯片、五种机架规模计算机,专为智能体AI设计。

Vera Rubin平台的核心突破包括:第六代NVLink 72互联技术,实现130TB/s的全对全带宽;100%液冷设计,使用45摄氏度热水,大幅降低数据中心冷却能耗;与Groq的LPU(语言处理单元)机架紧密集成,作为令牌加速器;以及全球首款采用共封装光学(CPO)技术的Spectrum-X交换机。黄仁勋称,该平台将推理吞吐量在关键层级再次提升了10倍。

如果说Vera Rubin提供了智能体时代的“硬件基础”,那么OpenClaw的出现则带来了“软件革命”。黄仁勋以极大热情介绍了这个“人类历史上增长最快的开源项目”。他将OpenClaw类比为“智能体计算机的操作系统”,就像Windows之于PC,它提供了资源管理、工具调用、任务分解、子智能体调度、多模态I/O等核心功能。

现在,全球每家公司的CEO都需要思考:你的OpenClaw战略是什么?”黄仁勋断言,正如过去企业需要Linux战略、HTML战略、Kubernetes战略一样,智能体战略已成为必然。他预测,未来的每一个SaaS(软件即服务)公司都将转变为GaaS(智能体即服务)公司。

然而,企业级智能体面临安全与隐私的严峻挑战。为此,NVIDIA与OpenClaw创始人合作,推出了企业级安全解决方案“Open Shell”,并将其集成到参考设计“Nemo Claw”中。该方案包含策略引擎、防护栏和隐私路由器,确保智能体在企业内部安全运行。同时,NVIDIA宣布了“开放模型计划”,发布了包括Neotron(语言)、Cosmos(物理世界)、Groot(机器人)、BioNeo(生物)、Earth-2(气候)在内的六大前沿模型家族,并联合Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity等众多明星公司组成“Neotron联盟”,共同推进开源模型生态。

物理AI崛起:从自动驾驶到迪士尼机器人

智能体不仅存在于数字世界,也正以机器人的形式融入物理世界。黄仁勋宣布,自动驾驶的“ChatGPT时刻”已经到来。NVIDIA的自动驾驶平台Drive Alpamo现已具备推理能力。他现场宣布比亚迪、现代、日产、吉利四家新合作伙伴加入其“机器人出租车就绪平台”,这些公司年产量合计达1800万辆。此外,NVIDIA还与Uber达成合作,将在多个城市部署自动驾驶车队。

在更广泛的机器人领域,黄仁勋表示,全球几乎所有主要的机器人公司都在与NVIDIA合作。现场展示了超过110台机器人。他重点介绍了用于机器人训练和仿真的Isaac Lab平台,以及用于可微分物理模拟的Warp和Newton库。最引人注目的演示来自迪士尼:其研究团队利用NVIDIA的Newton物理模拟器和Isaac Lab,训练了包括《冰雪奇缘》中雪宝Olaf在内的角色机器人,使其能够适应物理世界并自主互动,预示着未来主题乐园的全新体验。

演讲最后,黄仁勋以一段融合了所有关键信息的说唱视频收尾,气氛达到高潮。他重申,我们正处于一场巨大的平台迁移开端,AI工厂、智能体革命和物理AI将共同塑造未来。面对未来直至2027年“至少一万亿美元”的AI基础设施需求,NVIDIA通过其垂直整合与水平开放的策略,正致力于为这个新时代提供从底层芯片到顶层智能体的全栈动力。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接