[AI] 智谱即将推出GLM-4.5系列,采用混合专家结构的多模态大模型

[复制链接]
7 |0
未来视野 发表于 昨天 20:30 | 显示全部楼层 |阅读模式    IP属地:广东东莞
根据modelscope/ms-swift代码库的commit记录,智谱公司正筹备发布GLM-4.5系列模型。该系列预计将采用创新的混合专家(MoE)结构,定位为多模态可扩展大模型。

据悉,GLM-4.5系列将包含GLM-4.5(355B-A32B)和GLM-4.5-Air(106B-A12B)两款模型,具备高吞吐推理、结构化工具调用、可解释推理追踪及分布式负载均衡等先进特性。该模型支持多专家分组、负载均衡、分布式推理及多token预测(MTP)推理,进一步提升了模型的灵活性和处理能力。

在功能上,GLM-4.5系列添加了新的推理解析器和工具调用解析器,使模型能够输出严格的推理内容和工具调用内容,便于进行工具增强推理与函数调用。文档显示,该模型支持文本(T)、图像(I)、可扩展(E+)及视觉扩展(V+),表明其定位为多模态增强大模型,能够处理更加复杂和多样的任务。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表