黄仁勋论极致共构、AI尺度法则与下一座“AI工厂”

撰文：Techub News 整理

NVIDIA 创始人兼 CEO 黄仁勋在与 Lex Fridman 的长访谈中，系统阐述了他如何把 NVIDIA 从“为游戏做显卡”的公司，演进为主导 AI 计算平台的企业；他详细说明了“极致共构”（extreme co-design）、AI 的四条尺度法则、关键瓶颈（如算力、供电、记忆体与供应链），以及他对未来代理化（agentic）AI、推理（inference）与“AI 工厂”概念的深刻见解。

为什么要做“极致共构”

问题不再适合单台计算机：当要追求远超简单增加机器数量的速度提升时，必须把算法进行拆分、重构与分片；这使得计算、记忆体、网络、交换设备、供电与散热等都成为关键设计变量，彼此之间高度耦合，必须同时优化。
Amdahl 定律的现实：加速计算本身会遇到并行的极限——若计算只占整体工作量的一部分，把某一环节加速很可能对总体提升有限，因此必须系统化优化整个堆栈以避免线性扩展的瓶颈。
从芯片到机架、从机架到数据中心：NVIDIA 不只是做 GPU，而是在芯片、CPU、记忆体、网络、存储、供电、散热、软件乃至整机架、Pod 与数据中心层面做共同设计，目标是让整体系统的 tokens/秒/瓦（性能/功耗）大幅提升。

公司组织与协作模式：把公司当作“生产机制”

组织架构的出发点是产出：黄仁勋强调，公司结构应围绕“要产生什么产品”来设计，而非大量套用通用的组织图；NVIDIA 的直接幕僚约 60 人，绝大多数仍保持在工程领域，形成跨领域的“合攻”讨论文化（present problem, attack together）。
不做一对一管理，而是把问题摆在桌面上由多人共同攻关，既能兼顾专家深度，也能让跨领域意见即时交叉修正（例如冷却的方案会影响电源与记忆体布局）。

关键的战略赌注：把 CUDA 放到 GeForce

从加速器到可编程计算平台：NVIDIA 要走出“高度专业化但市场受限”的陷阱，逐步扩展到“可编程”、更广泛的计算领域——从可编程像素着色器、到在着色器中加入 IEEE FP32，再到 Cg 与后来的 CUDA，一步步把 GPU 变成通用的高效并行计算平台。
为了吸引开发者，最重要的是安装基数（install base）：黄仁勋解释，把 CUDA 放到大众的 GeForce 消费级显卡上，虽然当时大幅压缩公司毛利（公司市值一度大跌），却为后来在学界、工程界与科研界培育了海量用户与开发者，这一决策最终成为深度学习革命的基石。

如何做出“大胆赌注”的领导决策

以理性推演与持续塑造信念为基础：黄仁勋说他由好奇心与理性推演形成对未来的信念，然后不断用演讲、与内部外部沟通（如 GTC 大会）逐步塑造员工、伙伴与业界的认知；在宣布重大战略之前，他会一步步在公司内部播下想法的“砖块”，使最终决策获得广泛认同。
领导的节奏与耐心：很多重大转变看似突然，但往往是多年铺垫的结果；他把这些布置视为“把员工、客户与合作伙伴带到未来的同路人”，而非一纸命令式的重组或口号式变革。

AI 的尺度法则：四条法则与其含义

黄仁勋在访谈中把 AI 的发展总结为四道尺度法则，并解释每一条的本质与现实影响。

预训练（Pre-training）尺度法则

核心：模型越大，需要的数据越多，数据规模与模型能力之间存在可被持续利用的尺度关系。
数据不是无限制来自自然：黄仁勋指出，很多训练数据未来会越来越依赖“合成数据”（synthetic data），也就是由 AI 或工具生成并增强的数据，这会把数据短缺问题转化为“算力”问题——即训练受限于可用的计算资源而非原始数据本身。

后训练（Post-training）尺度法则

含义：在基础预训练后，利用微调、强化学习等方法继续提升模型能力；合成数据、增强数据与不断循环的训练-生成-再训练流程都属于这一环节的扩展，从而推动能力持续提升。

测试时（Test-time / Inference）尺度法则

误解与真实：早期有人认为推理将很“轻量”，但黄仁勋反驳说“推理就是思考，思考很难”，因此推理阶段往往需要大量计算资源，尤其当模型需要实时规划、推理与搜索时，推理端的硬件反而可能成为最大的市场与技术挑战。
推理 = 思考：预训练更像“阅读与记忆”，而推理涉及“推理、规划、问题分解与搜索”，这些任务在硬件上通常更复杂且计算密集。

代理化（Agentic）尺度法则

含义：当一个 AI 变得能够主动使用工具、发起行动、拆解任务并生成子代理（sub-agents）时，会出现“乘数效应”——AI 自身会生成更多的数据、经验与任务，从而形成自我增强的闭环（agents → 产生新数据 → 回到预训练与微调阶段）。
后果：代理化会使得需求的算力、IO、存储、实时性与安全性大幅上升，也会把“如何让代理安全访问数据、执行代码与与外部通信”成为关键的工程与治理问题。

硬件与体系结构的节奏差异：预判比跟随重要

模型架构更新频率远快于硬件迭代：AI 模型每 ~6 个月会出现显著新结构，而系统/硬件架构通常是以年为单位（例如 2–3 年或更长）演进，因此公司必须通过研究、与外部伙伴的持续交流以及“具有适配性的架构”来预测未来需求并预先设计硬件。
CUDA 的作用：其可编程与灵活性让 NVIDIA 在面对算法变化时仍能快速适配；例如在出现 Mixture-of-Experts（MoE）等架构时，NVIDIA 提前通过 NVLink、机架设计与软件层支持来保证可运行性与效率。

从 Grace 到 Vera Rubin：为不同工作负载设计机架

针对不同任务（例如 MoE 型推理或 agent 型系统）NVIDIA 设计了不同机架（如 Grace Blackwell、Vera Rubin、Rock 等），每个机架在 CPU、内存、NVLink、存储加速器等方面侧重点不同，以满足训练、推理与 agent 运行时不同的 IO 与互联需求。

构建“AI 工厂”的愿景：工具、IO 与研究能力

数字工人与工具生态：若把 LLM 想象成“数字工人”，这个“工人”要对真相进行查询（文件系统）、做研究、调动工具并执行任务，那么系统必须为其提供安全的 IO、工具访问与权限控制；这也是为什么黄仁勋在两年前就开始论述类似 OpenClaw（agentic 架构）的设计理念。
工具不会消失：相反，AI 会使用现有工具并从外部获取知识；软件与工具仍然重要，因为智能体在现实世界里需要接口与现成设备来完成工作，而不是把每一种功能都内生于单一模型之中。

安全与访问控制：两权三能的原则

对代理系统的三项能力：访问敏感信息、执行代码、与外界通信是三项关键能力，黄仁勋提出可以通过“给出其中两项但抑制三项同时具备”的策略来降低风险，并将这些能力与企业已有的策略引擎与权限体系整合（例如 OpenShell、NemoClaw 等方案），以帮助 OpenClaw 与相似系统在企业环境中的安全落地。

算力、供电与记忆体：真正的瓶颈在哪里

能源与效率：即使能通过极致共构持续提升 tokens/秒/瓦的效率，能源仍然是现实世界扩展的限制之一；黄仁勋提到未来需要在功耗、效率、以及如何获得更多能源（包括小型模块化核电等选项）上持续投入并与合作伙伴共建生态。
供应链挑战：先进制造与封装（如 ASML 的 EUV、TSMC 的 CoWoS、高带宽记忆体 HBM 等）是全球产业链上不可或缺但又稀缺的要素；NVIDIA 必须长期与这些供应链节点紧密合作以保证交付与演进。
记忆体（Memory）与互联：大模型在运行时对记忆体带宽、容量与互联延迟的需求极高，因此除了芯片微架构，也需在机架层次设计 NVLink 高带宽互联与存储加速器来满足 agent 与大规模推理的 IO 需求。

对美中关系、台积电与台湾的看法（访谈节选）

供应链与地缘政治：黄仁勋在访谈中亦讨论了中国、台积电与台湾在全球半导体供应链中的重要性与复杂性，强调公司必须应对地缘政治带来的不确定性，并与全球伙伴协同以减轻风险（逐字稿中有专门章节详述）。

企业护城河（NVIDIA 的“护城河”）

软硬结合的生态：黄仁勋认为 NVIDIA 的护城河不是单一硬件或技术，而是从芯片、互联、系统、软件到开发者生态的一整套平台能力；这包括 CUDA 的广泛部署、长期积累的开发者基础与与产业各环节的合作网络。

关于未来价值（NVIDIA 的估值与宏观思考）

市场想象力与长期价值：访谈中谈到“公司是否可能达到万亿美元级甚至更高估值”的讨论，黄仁勋认为价值由长期技术与生态的创造决定，而这取决于能否持续把计算能力降低成本并推动全社会在生产力层面的变革（逐字稿中有更详细问答）。

领导力、工程文化与人才

塑造共识的艺术：黄仁勋强调领导力不仅是决策，更是塑造整家公司与产业共识的过程；通过持续的传播、研讨、与展示（例如在 GTC 的多次演讲）把外界与内部对未来的认知一步步对齐。
工程实践：NVIDIA 强调工程师对细节的极致追求，把系统设计当作长期的文明工程，既关注短期产品，也关注能否通过架构让未来的算法与软件进化得以承载。

关于 AGI、意识与人类层面的问题（简要）

AGI 时间线与哲思：在访谈后半段，双方讨论了 AGI 的时间、意识、编程未来、甚至生命终结等哲学与人文话题；黄仁勋以务实、工程为先的视角，提出对技术落地、安全、伦理应有的关注（逐字稿中有详细讨论）。

结语

黄仁勋在这场长谈里呈现的不仅是技术细节，更多是对“如何把科技变成产业化力量”的系统思考：从深耕硬件架构、打造可编程平台、开拓开发者基础，到预见 agentic AI 带来的新需求与治理边界，NVIDIA 的路径展示了一家公司如何用工程逻辑与策略耐心去塑造未来生态。读者可回看完整逐字稿或视频以获取逐段原话细节与具体时间戳。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

黄仁勋论极致共构、AI尺度法则与下一座“AI工厂”

Techub News的精选文章

目录

相关文章