NVIDIA CEO Jensen Huang（黄仁勋）：AI 驱动计算范式革命，开放模型与可持续能源是关键

撰文：Techub News 整理

近日，NVIDIA CEO Jensen Huang（黄仁勋）重返母校斯坦福大学，在计算机科学前沿系统课程中进行了长达近一个小时的深度分享。在这场对话中，黄仁勋不仅回顾了 NVIDIA 引领 AI 计算革命的历程，更前瞻性地阐述了 AI 如何从根本上重塑整个计算栈、为何开放模型至关重要，以及面对能源瓶颈的应对策略。作为深度参与并定义当前 AI 浪潮的关键人物，他的见解为理解未来技术趋势提供了清晰的框架。

计算范式的根本性变革：从“预录制”到“实时生成”

黄仁勋开篇即指出，当前是计算机科学历史上一个前所未有的激动人心的时刻。计算正在经历 60 多年来最剧烈的重塑。自 IBM System 360 以来，计算机的基本架构、编程模型乃至商业模式都保持了相对稳定。然而，AI，特别是深度学习与生成式 AI，彻底改变了这一切。

他将传统计算与 AI 驱动的计算进行了本质区分：过去，计算处理的是“预录制”的内容——预先存储的图像、视频、软件代码；而现在，计算的核心是“实时生成”。这种生成不仅是内容的创造，更是具备上下文一致性、相关性并能响应用户意图的智能输出。这意味着，从软件开发方法论、公司组织架构，到软件运行方式（神经网络 vs. 编译二进制文件），再到底层计算机系统、网络、存储，乃至顶层的云服务和应用程序，每一层都发生了根本性变化。

他以自动驾驶为例：在深度学习出现之前，实现全自动驾驶被认为是遥不可及的。但 AI 解锁了这一可能性，如今他相信“所有移动的东西都将自动化”。这种根本性的解锁，促使我们必须重新思考每一个环节：什么是 AI 时代的软件工程师？什么是 AI 时代的计算机？如何为其设计架构？最终能用它做什么？在哪里部署它？

黄仁勋将这一变革的起点追溯到约 15 年前。当生成式 AI（如 GPT）出现时，许多人关注的是其生成图像或文本的能力，但他看到了更深远的意义：AI 能够生成“思想”。生成内部消费的 token 就是思考，生成外部使用的 token 则是工具使用。GPT 的出现清晰地预示了“思考型”AI 的到来。如今，我们已步入“代理系统”时代，计算机不再是按需响应，而是持续运行。这又将引发对云服务、个人计算机等所有系统的新一轮重新思考。

协同设计的威力：百万倍性能提升与生态激活

当被问及“协同设计”为何如此重要时，黄仁勋追溯到了斯坦福的传统。他提到了 John Hennessy 教授在 RISC 架构上的工作之美：将编译器与微处理器架构和谐地协同设计，从而创造出比各自独立优化更好的整体性能。这一理念在 AI 时代被 NVIDIA 极致化。

他指出，在通用计算时代，人们倾向于用通用工具解决所有问题。但对于计算强度极高的特定领域（如昔日的计算机图形学、分子动力学、量子化学或如今的深度学习），通用计算机并非最优选择。NVIDIA 的核心理念是：深入理解算法、计算机系统、编译器、框架以及芯片架构，并对所有这些层面进行同步优化。NVIDIA 可能是第一家践行这种“极端协同设计”的计算机系统公司，其协同设计涵盖 CPU、GPU、网络、交换机和存储。

这种方法的成果是惊人的。在 Dennard 缩放失效、摩尔定律基本终结的过去十年，如果仅依赖微处理器自身的缩放，性能提升最多可能在 10 倍左右。而通过协同设计，NVIDIA 实现了十年内百万倍的性能提升。如此巨大的计算规模与速度飞跃，使得 AI 研究者可以提出“为何不直接使用整个互联网的数据？”这样的想法。当计算速度达到这种级别，一切关于计算的假设都改变了。

黄仁勋强调，正是这种协同设计带来的加速计算，创造了“无限的丰裕机会”，让每个人都能重新构想未来。此外，NVIDIA 还通过创建基础模型来激活整个下游产业。例如，在生物领域创建 BioNeMo，在自动驾驶领域创建 Alpamayo，在人形机器人领域创建 Groot，在气候科学领域创建模型。如果没有 NVIDIA 率先投入构建这些基础模型，相关领域的科学家可能缺乏必要的规模和技术来启动工作。这种做法实质上是扩展并民主化 AI 能力。

他特别解释了为何 NVIDIA 要投入开放语言模型（如 Nemotron）。原因有二：其一，世界上许多语言的规模不足以让大型商业实体将其视为高优先级，但每种语言代表的智能都应被重视；其二，将语言模型与领域特定模型融合至关重要，因为人类先验知识能极大提升效率。例如，Alpamayo（自动驾驶模型）融合了语言模型与世界模型，使其能像人类一样推理，从而大幅减少所需的训练数据量，证明了其高效性与安全性。

关于模型安全，黄仁勋提出了一个鲜明观点：要实现安全可靠的 AI，它必须是开放的。你无法防御一个黑盒，也无法保障一个黑盒的安全。透明的系统允许所有人审视它，研究人员可以使用它。面对未来的网络安全挑战，最聪明的方式不是与更强大的攻击模型进行版本竞赛，而是利用数百万、数十亿个成本低廉的 AI（如 Nemotron Nano）组成“ swarm ”来系统性地防御。

度量、瓶颈与未来架构：超越“MFU”，聚焦真实性能

讨论转向了计算资源利用率与度量标准。黄仁勋对当前业界关注的“MFU”（模型浮点运算利用率）指标提出了批判。他认为，单纯追求高 MFU 可能是错误的。在大型数据中心中，浮点运算、内存带宽、内存容量、网络容量等资源中，总有一项会成为瓶颈。理想的做法是在所有方面都进行超额配置，以避免阿姆达尔定律的限制。这意味着，为了应对峰值负载，你会有大量浮点运算单元在平时闲置，MFU 较低，但在关键时刻却能提供 100% 的性能。

他类比道，过去人们问汽车“有多少马力”，但现在没人这么问了。关键在于真实的“性能”。对于 AI 计算，一个更相关的度量可能是“每瓦特产生的 token 数”（token per watt）。在大型语言模型解码阶段，生成 token 最关键的因素实际上是 NVLink 72 提供的聚合带宽，而此时 MFU 可能非常低。但并非所有 token 价值相等，因此最终需要回归到对“成功”的真实评估上。

黄仁勋坦言，为不同客户（他们各有不同的评估标准）设计底层平台架构是极其困难的。过度针对某个问题优化，可能在该领域表现惊人，但若市场不够大，则无法支撑庞大的研发。反之，如果什么都能做，就可能变得平庸。把握这种平衡是一种“艺术”，需要愿景、策略、试错和个人判断。

他随后勾勒了 NVIDIA 芯片架构的演进路线与未来展望：

Hopper：专为当时新兴的“预训练”问题设计，敢于构想并建造价值数十亿美元的系统，尽管最初看似没有客户。
Grace Blackwell：认识到 AI 的终极目标是“推理”，并创造了 NVLink 72 架构，将 72 个芯片聚合，提供极高的内存带宽以满足 token 生成需求，实现了两年内 50 倍的性能提升。
Vera Rubin：专为“代理”设计。代理需要长期记忆和工作记忆，存储需直接与 GPU 通信，CPU 则需要极低的延迟以响应 AI 发出的工具使用指令。
Feynman：展望未来，届时 AI 可能已完全软件化，形成“代理系统、子代理系统”的 swarm。Feynman 架构将为此类 swarm 计算模式而设计。

关于能源瓶颈，黄仁勋指出，未来计算将是“生成的”和“持续的”，与当前“按需检索”的模式截然不同。他估计，未来计算所需的能源可能是当前的1000 倍以上。应对之道首先在于提升能源效率（如 tokens per watt 指标），NVIDIA 已将其提升了 50 倍。其次，需要通过教育让整个生态做好准备。最后，可持续能源是关键。当前是投资可持续能源的最佳时机，因为市场力量足够强大，无需依赖政府补贴。升级电网、增加各种可持续能源是必须的。

教育、战略与责任：CEO 的视角

对于教育如何适应行业变革，黄仁勋认为 AI 必须融入课程，不仅是学习 AI，更是使用 AI 辅助学习。传统教科书无法跟上 AI 实时生成的信息与知识步伐。他分享了自己的学习方式：阅读论文后，让 AI 去阅读相关论文，使其成为“专属超级研究员”，然后与之深入互动。

在职业选择上，他给出了务实的建议：追求热爱与激情固然好，但许多人并不知道自己热爱什么。他认为，“只选择带来快乐的工作”是一个过高的标准。他坦言，作为 CEO，他只热爱约 10% 的工作，其余 90% 是艰难且需要“承受”的。但这种“承受”能锻造韧性与坚韧，在未来世界、家庭、公司或同事需要你坚强时，你会需要这种品质。

谈及早期最大的战略错误，黄仁勋提到了 NVIDIA 曾涉足移动设备市场。虽然一度建立起十亿美元的业务，但在 3G 向 4G 过渡时被彻底挤出。他反思，当时若能多想几步，应能预见其短暂性，从而将资源集中在其他领域。不过，从移动设备积累的极低功耗与高能效技术，后来成功转化到了当时尚不存在的“机器人”应用中，如今的 Thor 芯片正是其技术谱系的延续。

关于战略与 forecasting，黄仁勋的方法是基于观察，回归第一性原理进行推理，构建未来的心智模型，然后反向推导公司定位。他承认预测可能不完全正确，关键在于如何降低机会成本、增加可选性，并努力让旅程本身产生价值。

最后，黄仁勋以强烈的个人信念回应了关于技术出口、竞争与行业未来的话题。他反对将 NVIDIA GPU 类比为原子武器，强调其是通用计算工具，应用于游戏、医疗成像等无数有益领域。他坚信美国科技产业是国家宝藏，不应通过政策放弃全球三分之二的市场，否则毕业生将进入一个萎缩的行业。他驳斥了关于 AI “奇点”突然降临、无法防御、会接管世界的科幻式恐惧，认为这些说法不负责任且不真实。他呼吁创造一个对技术乐观的未来，并坚信每个人都应拥有 AI，而不是核武器。

对于大学获取计算资源的难题，他直言问题在于系统本身：研究部门各自为政， grants 规模不足以支撑大型共享计算设施。他建议斯坦福这类拥有雄厚 endowment 的大学，应主动变革预算与计算资源分配方式，投资建设校园级超级计算机或购买相应的云服务，让每位学生和研究者都能访问 AI 超算。这需要规划和决心，而非简单地指责供应方。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

NVIDIA CEO Jensen Huang（黄仁勋）：AI 驱动计算范式革命，开放模型与可持续能源是关键

计算范式的根本性变革：从“预录制”到“实时生成”

协同设计的威力：百万倍性能提升与生态激活

度量、瓶颈与未来架构：超越“MFU”，聚焦真实性能

教育、战略与责任：CEO 的视角

Techub News的精选文章

目录

相关文章