撰文:Techub News 整理
近日,NVIDIA CEO Jensen Huang(黄仁勋)重返母校斯坦福大学,在计算机科学前沿系统课程中进行了长达近一个小时的深度分享。在这场对话中,黄仁勋不仅回顾了 NVIDIA 引领 AI 计算革命的历程,更前瞻性地阐述了 AI 如何从根本上重塑整个计算栈、为何开放模型至关重要,以及面对能源瓶颈的应对策略。作为深度参与并定义当前 AI 浪潮的关键人物,他的见解为理解未来技术趋势提供了清晰的框架。
计算范式的根本性变革:从“预录制”到“实时生成”
黄仁勋开篇即指出,当前是计算机科学历史上一个前所未有的激动人心的时刻。计算正在经历 60 多年来最剧烈的重塑。自 IBM System 360 以来,计算机的基本架构、编程模型乃至商业模式都保持了相对稳定。然而,AI,特别是深度学习与生成式 AI,彻底改变了这一切。
他将传统计算与 AI 驱动的计算进行了本质区分:过去,计算处理的是“预录制”的内容——预先存储的图像、视频、软件代码;而现在,计算的核心是“实时生成”。这种生成不仅是内容的创造,更是具备上下文一致性、相关性并能响应用户意图的智能输出。这意味着,从软件开发方法论、公司组织架构,到软件运行方式(神经网络 vs. 编译二进制文件),再到底层计算机系统、网络、存储,乃至顶层的云服务和应用程序,每一层都发生了根本性变化。
他以自动驾驶为例:在深度学习出现之前,实现全自动驾驶被认为是遥不可及的。但 AI 解锁了这一可能性,如今他相信“所有移动的东西都将自动化”。这种根本性的解锁,促使我们必须重新思考每一个环节:什么是 AI 时代的软件工程师?什么是 AI 时代的计算机?如何为其设计架构?最终能用它做什么?在哪里部署它?
黄仁勋将这一变革的起点追溯到约 15 年前。当生成式 AI(如 GPT)出现时,许多人关注的是其生成图像或文本的能力,但他看到了更深远的意义:AI 能够生成“思想”。生成内部消费的 token 就是思考,生成外部使用的 token 则是工具使用。GPT 的出现清晰地预示了“思考型”AI 的到来。如今,我们已步入“代理系统”时代,计算机不再是按需响应,而是持续运行。这又将引发对云服务、个人计算机等所有系统的新一轮重新思考。
协同设计的威力:百万倍性能提升与生态激活
当被问及“协同设计”为何如此重要时,黄仁勋追溯到了斯坦福的传统。他提到了 John Hennessy 教授在 RISC 架构上的工作之美:将编译器与微处理器架构和谐地协同设计,从而创造出比各自独立优化更好的整体性能。这一理念在 AI 时代被 NVIDIA 极致化。
他指出,在通用计算时代,人们倾向于用通用工具解决所有问题。但对于计算强度极高的特定领域(如昔日的计算机图形学、分子动力学、量子化学或如今的深度学习),通用计算机并非最优选择。NVIDIA 的核心理念是:深入理解算法、计算机系统、编译器、框架以及芯片架构,并对所有这些层面进行同步优化。NVIDIA 可能是第一家践行这种“极端协同设计”的计算机系统公司,其协同设计涵盖 CPU、GPU、网络、交换机和存储。
这种方法的成果是惊人的。在 Dennard 缩放失效、摩尔定律基本终结的过去十年,如果仅依赖微处理器自身的缩放,性能提升最多可能在 10 倍左右。而通过协同设计,NVIDIA 实现了十年内百万倍的性能提升。如此巨大的计算规模与速度飞跃,使得 AI 研究者可以提出“为何不直接使用整个互联网的数据?”这样的想法。当计算速度达到这种级别,一切关于计算的假设都改变了。
黄仁勋强调,正是这种协同设计带来的加速计算,创造了“无限的丰裕机会”,让每个人都能重新构想未来。此外,NVIDIA 还通过创建基础模型来激活整个下游产业。例如,在生物领域创建 BioNeMo,在自动驾驶领域创建 Alpamayo,在人形机器人领域创建 Groot,在气候科学领域创建模型。如果没有 NVIDIA 率先投入构建这些基础模型,相关领域的科学家可能缺乏必要的规模和技术来启动工作。这种做法实质上是扩展并民主化 AI 能力。
他特别解释了为何 NVIDIA 要投入开放语言模型(如 Nemotron)。原因有二:其一,世界上许多语言的规模不足以让大型商业实体将其视为高优先级,但每种语言代表的智能都应被重视;其二,将语言模型与领域特定模型融合至关重要,因为人类先验知识能极大提升效率。例如,Alpamayo(自动驾驶模型)融合了语言模型与世界模型,使其能像人类一样推理,从而大幅减少所需的训练数据量,证明了其高效性与安全性。
关于模型安全,黄仁勋提出了一个鲜明观点:要实现安全可靠的 AI,它必须是开放的。你无法防御一个黑盒,也无法保障一个黑盒的安全。透明的系统允许所有人审视它,研究人员可以使用它。面对未来的网络安全挑战,最聪明的方式不是与更强大的攻击模型进行版本竞赛,而是利用数百万、数十亿个成本低廉的 AI(如 Nemotron Nano)组成“ swarm ”来系统性地防御。
度量、瓶颈与未来架构:超越“MFU”,聚焦真实性能
讨论转向了计算资源利用率与度量标准。黄仁勋对当前业界关注的“MFU”(模型浮点运算利用率)指标提出了批判。他认为,单纯追求高 MFU 可能是错误的。在大型数据中心中,浮点运算、内存带宽、内存容量、网络容量等资源中,总有一项会成为瓶颈。理想的做法是在所有方面都进行超额配置,以避免阿姆达尔定律的限制。这意味着,为了应对峰值负载,你会有大量浮点运算单元在平时闲置,MFU 较低,但在关键时刻却能提供 100% 的性能。
他类比道,过去人们问汽车“有多少马力”,但现在没人这么问了。关键在于真实的“性能”。对于 AI 计算,一个更相关的度量可能是“每瓦特产生的 token 数”(token per watt)。在大型语言模型解码阶段,生成 token 最关键的因素实际上是 NVLink 72 提供的聚合带宽,而此时 MFU 可能非常低。但并非所有 token 价值相等,因此最终需要回归到对“成功”的真实评估上。
黄仁勋坦言,为不同客户(他们各有不同的评估标准)设计底层平台架构是极其困难的。过度针对某个问题优化,可能在该领域表现惊人,但若市场不够大,则无法支撑庞大的研发。反之,如果什么都能做,就可能变得平庸。把握这种平衡是一种“艺术”,需要愿景、策略、试错和个人判断。
他随后勾勒了 NVIDIA 芯片架构的演进路线与未来展望:
- Hopper:专为当时新兴的“预训练”问题设计,敢于构想并建造价值数十亿美元的系统,尽管最初看似没有客户。
- Grace Blackwell:认识到 AI 的终极目标是“推理”,并创造了 NVLink 72 架构,将 72 个芯片聚合,提供极高的内存带宽以满足 token 生成需求,实现了两年内 50 倍的性能提升。
- Vera Rubin:专为“代理”设计。代理需要长期记忆和工作记忆,存储需直接与 GPU 通信,CPU 则需要极低的延迟以响应 AI 发出的工具使用指令。
- Feynman:展望未来,届时 AI 可能已完全软件化,形成“代理系统、子代理系统”的 swarm。Feynman 架构将为此类 swarm 计算模式而设计。
关于能源瓶颈,黄仁勋指出,未来计算将是“生成的”和“持续的”,与当前“按需检索”的模式截然不同。他估计,未来计算所需的能源可能是当前的1000 倍以上。应对之道首先在于提升能源效率(如 tokens per watt 指标),NVIDIA 已将其提升了 50 倍。其次,需要通过教育让整个生态做好准备。最后,可持续能源是关键。当前是投资可持续能源的最佳时机,因为市场力量足够强大,无需依赖政府补贴。升级电网、增加各种可持续能源是必须的。
教育、战略与责任:CEO 的视角
对于教育如何适应行业变革,黄仁勋认为 AI 必须融入课程,不仅是学习 AI,更是使用 AI 辅助学习。传统教科书无法跟上 AI 实时生成的信息与知识步伐。他分享了自己的学习方式:阅读论文后,让 AI 去阅读相关论文,使其成为“专属超级研究员”,然后与之深入互动。
在职业选择上,他给出了务实的建议:追求热爱与激情固然好,但许多人并不知道自己热爱什么。他认为,“只选择带来快乐的工作”是一个过高的标准。他坦言,作为 CEO,他只热爱约 10% 的工作,其余 90% 是艰难且需要“承受”的。但这种“承受”能锻造韧性与坚韧,在未来世界、家庭、公司或同事需要你坚强时,你会需要这种品质。
谈及早期最大的战略错误,黄仁勋提到了 NVIDIA 曾涉足移动设备市场。虽然一度建立起十亿美元的业务,但在 3G 向 4G 过渡时被彻底挤出。他反思,当时若能多想几步,应能预见其短暂性,从而将资源集中在其他领域。不过,从移动设备积累的极低功耗与高能效技术,后来成功转化到了当时尚不存在的“机器人”应用中,如今的 Thor 芯片正是其技术谱系的延续。
关于战略与 forecasting,黄仁勋的方法是基于观察,回归第一性原理进行推理,构建未来的心智模型,然后反向推导公司定位。他承认预测可能不完全正确,关键在于如何降低机会成本、增加可选性,并努力让旅程本身产生价值。
最后,黄仁勋以强烈的个人信念回应了关于技术出口、竞争与行业未来的话题。他反对将 NVIDIA GPU 类比为原子武器,强调其是通用计算工具,应用于游戏、医疗成像等无数有益领域。他坚信美国科技产业是国家宝藏,不应通过政策放弃全球三分之二的市场,否则毕业生将进入一个萎缩的行业。他驳斥了关于 AI “奇点”突然降临、无法防御、会接管世界的科幻式恐惧,认为这些说法不负责任且不真实。他呼吁创造一个对技术乐观的未来,并坚信每个人都应拥有 AI,而不是核武器。
对于大学获取计算资源的难题,他直言问题在于系统本身:研究部门各自为政, grants 规模不足以支撑大型共享计算设施。他建议斯坦福这类拥有雄厚 endowment 的大学,应主动变革预算与计算资源分配方式,投资建设校园级超级计算机或购买相应的云服务,让每位学生和研究者都能访问 AI 超算。这需要规划和决心,而非简单地指责供应方。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。
