发帖
客户端
扫码下载

[电脑] 国产GPU厂商曦望发布启望S3推理芯片,性能提升成本大降

[复制链接]
11 |0
未来视野 发表于 前天 00:08 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
国产GPU厂商曦望发布了新一代推理GPU芯片启望S3,这是该公司在近一年累计完成约30亿元战略融资后的首次公开亮相。启望S3作为一款面向大模型推理的定制化GPGPU芯片,在典型推理场景下的整体性价比较上一代产品提升超过10倍。该芯片支持FP16至FP4精度切换,采用LPDDR6显存方案,显存容量较上一代提升4倍,为用户提供了更强大的计算能力和更大的存储空间。

在应用层面,启望S3在DeepSeek V3/R1满血版等主流大模型推理场景中表现出色,单位Token成本较上一代降低约90%,显著降低了大模型推理的成本。此外,曦望还同步发布了面向大模型推理的寰望SC3-256超节点方案,可适配千亿、万亿级参数的多模态MoE推理场景,进一步拓展了芯片的应用范围。

为了推动大模型推理成本的降低,曦望还联合商汤科技、第四范式等生态伙伴,共同发起了“百万Token一分钱”推理成本计划。同时,曦望与浙江大学签署了战略合作协议,联合成立“智能计算联合研发中心”,旨在通过产学研合作,推动智能计算技术的发展和创新。

据了解,曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近30亿元战略融资,展现了其强大的融资能力和市场潜力。2025年,曦望芯片交付量已突破万片,标志着该公司在GPU芯片领域取得了重要突破。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表