K线
数据链上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
语言
  • 简体中文
  • 繁体中文
  • English
全球行情数据应用领跑者,致力于更高效地提供有价值的信息。

功能

  • 实时行情
  • 特色功能
  • AI网格

服务

  • 资讯内容
  • 开放数据(API)
  • 机构服务

软件下载

  • PC版
  • Android版
  • iOS版

联系我们

  • 聊天室
  • 商务邮箱
  • 官方邮箱
  • 官方验证通道

加入社区

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|旧版

英伟达发布Nemotron 3 Super,一款为代理工作负载构建的120亿开放人工智能模型。

CN
bitcoin.com
关注
2小时前
AI 总结,5秒速览全文
  • Nvidia 发布了 Nemotron 3 Super,这是一个 120B 参数的开放 MoE 模型,仅在每次前向传播中激活 12.7B 参数。
  • 在 8k 输入 / 64k 输出设置下,Nemotron 3 Super 在代理工作负载中提供比 Qwen3.5-122B-A10B 高达 7.5 倍的吞吐量。
  • 该模型在 Nvidia Nemotron 开放模型许可证下完全开放,检查点和训练数据在 Hugging Face 上提供。

最新的 Nvidia 模型使用专家混合(MoE)架构,每次前向传播仅激活 12.7 亿参数,这意味着在推理过程中大部分权重保持空闲。这个设计选择直接针对开发者在部署多步骤 AI 代理时遇到的两个问题:扩展推理链的额外成本和在多代理管道中可能增加到 15 倍的令牌使用。

Nemotron 3 Super 是 Nvidia Nemotron 3 系列中的第二个模型,继 2025 年 12 月的 Nemotron 3 Nano 之后发布。Nvidia 于 2026 年 3 月 10 日左右宣布发布。

该模型在 88 层中使用混合 Mamba-Transformer 主干。Mamba-2 块以线性时间效率处理长序列,而 Transformer 注意力层则保留准确回忆。这种组合使模型本土支持高达一百万个令牌的上下文窗口,而没有纯注意力设计通常会有的内存惩罚。

Nvidia 还内置了一个 LatentMoE 路由系统,该系统在将令牌嵌入发送到每层的 512 个专家之前,将其压缩到低秩空间中,同时一次激活 22 个。该公司表示,这使得在相同推理成本下,大约有四倍更多的专家,并实现了更细化的任务专业化,例如在专家级别将 Python 逻辑与 SQL 处理分开。

Nvidia 发布了 Nemotron 3 Super,一个为代理工作负载构建的 120B 开放 AI 模型

图片来源:Nvidia 博客。

多令牌预测层使用两个共享权重头,加速思维链生成并允许本地推测解码。在结构化任务上,Nvidia 报告生成速度最快可达三倍。

该模型在两个阶段上预训练了 25 万亿个令牌。第一阶段使用了 20 万亿个广泛数据的令牌。第二阶段使用了五万亿个为基准性能优化的高质量令牌。最后的扩展阶段在 51 亿个令牌上扩展了本土上下文至一百万个令牌。训练后包括对大约七百万个样本的监督微调,以及在 21 个环境中进行的超过 120 万次的强化学习。

在基准测试中,Nemotron 3 Super 在 MMLU-Pro 上得分 83.73,在 AIME25 上得分 90.21,在使用 OpenHands 的 SWE-Bench 上得分 60.47。在 PinchBench 上,它达到了 85.6%,在其类别的开放模型中是最高得分。在长上下文评估中,它在 RULER 1M 上得分 91.64。

与 GPT-OSS-120B 相比,Nemotron 3 Super 在 8k 输入和 64k 输出下提供 2.2 倍的吞吐量。与 Qwen3.5-122B-A10B 相对,该数字达到 7.5 倍。Nvidia 还报告说与之前的 Nemotron Super 代相比,吞吐量提升超过五倍,准确性提升高达两倍。

Nvidia 在其 NVFP4 四位浮点格式中端到端训练该模型,专为 Blackwell GPU 优化。在 B200 硬件上,Nvidia 表示推理速度比 H100 上的 FP8 快四倍,没有报告精度损失。量化的 FP8 和 NVFP4 检查点保留 99.8% 或更多的全精度准确性。

该模型还为 Nvidia AI-Q 研究代理提供支持,该代理在 Deepresearch Bench 排行榜上达到了最高位置。

Nemotron 3 Super 在 Nvidia Nemotron 开放模型许可证下完全开放。BF16、FP8 和 NVFP4 格式的检查点,以及预训练数据、后训练样本和强化学习环境,都可以在 Hugging Face 上获取。推理通过 Nvidia NIM、build.nvidia.com、Perplexity、Openrouter、Together AI、谷歌云、AWS、Azure 和 Coreweave 支持,并提供通过 Dell 企业中心和 HPE 的本地选项。

开发者可以通过 NeMo 平台使用 vLLM、SGLang 和 TensorRT-LLM 访问训练配方、微调指南和推理手册。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

bitcoin.com的精选文章

28分钟前
东京向推广数字日元使用的公司提供补贴
1小时前
报告:NYDIG接近收购阿尔科亚位于纽约马西纳的铝冶炼厂用于比特币采矿业务
3小时前
即将上映的“比特币”电影,由凯西·阿弗莱克和加尔·加朵主演,探讨中本聪的身份。
查看更多

目录

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

相关文章

avatar
avatarbitcoin.com
28分钟前
东京向推广数字日元使用的公司提供补贴
avatar
avatarbitcoin.com
1小时前
报告:NYDIG接近收购阿尔科亚位于纽约马西纳的铝冶炼厂用于比特币采矿业务
avatar
avatarbitcoin.com
3小时前
即将上映的“比特币”电影,由凯西·阿弗莱克和加尔·加朵主演,探讨中本聪的身份。
avatar
avatarbitcoin.com
4小时前
比特币在伊朗拒绝第二轮美国和平谈判后跌至74,000美元以下
APP下载
Windows
Mac

X

Telegram

Facebook

Reddit

复制链接