国产GPU厂商曦望发布了新一代推理GPU芯片启望S3,这是该公司在近一年累计完成约30亿元战略融资后的首次公开亮相。启望S3作为一款面向大模型推理的定制化GPGPU芯片,在典型推理场景下的整体性价比较上一代产品提升超过10倍。该芯片支持FP16至FP4精度切换,采用LPDDR6显存方案,显存容量较上一代提升4倍,为用户提供了更强大的计算能力和更大的存储空间。
在应用层面,启望S3在DeepSeek V3/R1满血版等主流大模型推理场景中表现出色,单位Token成本较上一代降低约90%,显著降低了大模型推理的成本。此外,曦望还同步发布了面向大模型推理的寰望SC3-256超节点方案,可适配千亿、万亿级参数的多模态MoE推理场景,进一步拓展了芯片的应用范围。
为了推动大模型推理成本的降低,曦望还联合商汤科技、第四范式等生态伙伴,共同发起了“百万Token一分钱”推理成本计划。同时,曦望与浙江大学签署了战略合作协议,联合成立“智能计算联合研发中心”,旨在通过产学研合作,推动智能计算技术的发展和创新。
据了解,曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近30亿元战略融资,展现了其强大的融资能力和市场潜力。2025年,曦望芯片交付量已突破万片,标志着该公司在GPU芯片领域取得了重要突破。 |