火山引擎宣布推出豆包大模型1.6-vision版本。作为豆包大模型家族中首款具备工具调用能力的视觉深度思考模型,该版本通过差异化工具调用技术,将图像处理融入思维链,可实现定位、剪裁、点选、画线、缩放、旋转等精细操作,精准模拟人类“全局扫描-局部聚焦”的视觉推理过程。
官方信息显示,新模型在增强推理可解释性的同时,综合成本较上一代Doubao-1.5-thinking-vision-pro降低约50%。以32K输入输出场景为例,单次调用成本从5.25元降至2.6元。今年6月,火山引擎曾推出支持多模态思考的豆包大模型1.6版本,此次升级进一步强化了复杂场景下的视觉理解能力。 |