腾讯混元今日正式推出并开源了原生多模态图像生成模型“混元图像3.0(HunyuanImage 3.0)”,该模型参数规模达到80B,成为首个开源的工业级原生多模态生图模型。腾讯方面表示,混元图像3.0的效果可对标业界头部闭源模型,具备强大的图像生成能力。
除了基本的图像生成功能外,混元图像3.0模型还具备利用知识进行推理的能力,可以解析千字级别的复杂语义,并生成包含长文本的文字图像。这一升级使得模型在应对复杂场景和需求时表现出色。
此次发布的混元图像3.0是继今年5月发布的2.0版本后的又一次重要升级。2.0版本已经实现了毫秒级响应和超写实画质,支持实时生图功能,用户可以边打字边看到生成的图像。
腾讯混元系列此前已经陆续开源了3D生成模型(2.0/2.5版本)、定制化图像生成插件InstantCharacter以及多模态视频生成工具HunyuanCustom,形成了完整的AIGC(人工智能生成内容)技术矩阵。 |