英伟达推出Nemotron 3开源模型家族,包含Nano、Super和Ultra三种规格,宣称是构建AI智能体应用中"准确性最优的高效开源模型"。该系列采用突破性混合潜在专家(MoE)架构,可帮助开发者大规模部署可靠的多智能体系统,解决通信开销、上下文漂移及高推理成本等挑战。其中300亿参数的Nemotron 3 Nano模型实现4倍token处理吞吐量,推理成本降低60%,支持100万token上下文窗口;1000亿参数的Super模型与5000亿参数的Ultra模型分别面向高精度推理与复杂AI应用。
安永、思科、甲骨文云基础设施等12家企业已将该模型集成至AI工作流,覆盖制造业、网络安全、软件开发等领域。Nemotron 3 Nano现已开放下载,Super和Ultra版本将于2026年上半年推出。英伟达强调,通过提供表现力与开放性兼备的模型架构,可加速初创企业从原型开发到企业部署的创新周期。 |