12月16日,字节跳动旗下的Seed团队推出了新一代音视频创作模型Seedance 1.5 pro。该模型支持音视频联合生成,能够执行从文本到音视频的合成以及图像引导的音视频生成等多种任务,实现了声音与视觉的自然融合。
相比之前的Seedance 1.0版本,Seedance 1.5 pro不仅支持音频同步生成,还在视觉冲击力和运动效果上进行了显著提升。通过采用更加先进的技术方案,该模型在视听协同、视觉张力和叙事协调性等方面取得了突破性进展。它能够实现精准的音画同步,并原生支持多语种和特色方言口音,捕捉语音的独特韵律与情感张力。同时,模型还具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度运镜技巧,提升视频的动态张力。
在语义理解与叙事协调性方面,Seedance 1.5 pro也进行了增强,能够更好地解析叙事语境,提升音视频段落的整体叙事协调性,为专业级内容创作提供有力支撑。目前,该模型已在相关平台上线,其各项关键能力在综合评测中均处于业界前列。 |