发帖
客户端
扫码下载

[AI] 清华TSAIL实验室与生数科技联手:TurboDiffusion实现视频生成百倍加速

[复制链接]
5 |0
数码小喇叭 发表于 昨天 22:46 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
清华大学TSAIL实验室与生数科技携手,共同推出了一款开源视频生成加速框架——TurboDiffusion。该框架在确保视频质量不受影响的前提下,成功将端到端扩散生成的推理速度提升了100至200倍,为视频生成领域带来了革命性的突破。

在技术实现上,TurboDiffusion采用了SageAttention和SLA(稀疏线性注意力机制)来加速注意力计算过程,这一创新显著降低了模型在处理高分辨率视频时的算力需求。同时,研究团队还引入了rCM(时间步蒸馏)技术,有效减少了扩散模型的采样步数。这些技术方案的巧妙融合,使得模型在保持生成效果一致性的基础上,大幅削减了计算延迟。

根据GitHub页面公布的实测数据,TurboDiffusion的性能提升令人瞩目。在单张RTX 5090显卡上测试Wan-2.1-T2V-1.3B-480P模型时,原版生成5秒视频耗时184秒,而TurboDiffusion仅需1.9秒即可完成。对于参数量更大的Wan-2.2-I2V-A14B-720P模型,原版生成耗时高达4549秒(约1.2小时),TurboDiffusion则将其压缩至38秒。即便是在Wan-2.1-14B-480P模型上,耗时也从1676秒大幅减少至9.9秒,速度远超目前市面上的其他加速方案。

此外,TurboDiffusion还提供了多种规格的模型权重下载,并针对不同硬件进行了细致的优化。对于显存有限的消费级显卡,如RTX 5090、RTX 4090等,团队提供了量化版(Quantized)权重,并建议用户开启线性层量化功能以获得更好的性能。而对于拥有80GB以上显存的工业级显卡,如H100等,则推荐使用非量化版本以充分发挥其性能优势。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表