发帖
客户端
扫码下载
打印 上一主题 下一主题

[AI] 智谱发布GLM-4.6旗舰文本模型,性能全面升级并实现国产芯片混合量化部署

[复制链接]
4 |0
跳转到指定楼层
楼主
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
智谱今日正式推出GLM-4.6旗舰文本模型,作为GLM系列的最新力作,该模型在代码生成能力上实现了显著提升,较前代GLM-4.5提高了27%,成为目前国内已知最强的Coding模型。GLM-4.6总参数量达355B,激活参数32B,在高级编码、上下文长度、推理、搜索、写作及多语言翻译等所有核心能力上均超越了GLM-4.5。具体而言,其上下文窗口从128K扩展至200K,推理过程中支持调用工具,写作风格更贴近人类偏好,多语言翻译效果也得到进一步增强。

在基准测试中,GLM-4.6在AIME 25、LCB v6等八大榜单上的表现与Claude Sonnet 4/4.5不相上下,稳居国产模型首位。特别是在Claude Code环境下的74个真实编程任务测试中,GLM-4.6的表现超越了Claude Sonnet 4及其他国产模型。同时,该模型在平均token消耗上比GLM-4.5节省了30%以上,成为同类模型中成本最低的解决方案。为确保透明度和可信度,智谱已公开全部测试题目与Agent轨迹,供业界验证与复现。

值得一提的是,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片上投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,大幅降低了推理成本。此外,摩尔线程新一代GPU也可基于原生FP8精度稳定运行GLM-4.6,验证了MUSA架构和全功能GPU在生态兼容与快速支持方面的优势。

随着GLM-4.6的发布,智谱同步升级了GLM Coding Plan,推出最低20元包月的畅玩套餐及企业版套餐。此前订阅包月套餐的用户将自动升级至GLM-4.6,并新增图像识别与搜索能力,支持Claude Code、Roo Code等10余种主流编程工具。针对高频重度开发者,智谱还推出了GLM Coding Max套餐,用量是Claude Max (20x) plan的三倍。GLM-4.6和寒武纪、摩尔线程国产芯片的组合服务也将通过智谱MaaS平台面向大众和企业提供。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表