发帖

客户端

扫码下载

立即注册

登录

QQ登陆

切换到宽版

NekoTeco»社区 › 宅闻情报 › 数码资讯 › 腾讯混元开源端到端视频音效生成模型，实现视听沉浸体验 ...

返回列表发新帖

[AI] 腾讯混元开源端到端视频音效生成模型，实现视听沉浸体验

144 |0

数码小喇叭 发表于 25-8-28 19:15:18 | 显示全部楼层 |阅读模式

12 px

26 px

腾讯混元今日宣布开源Hunyuan-Foley端到端视频音效生成模型，该模型可通过输入视频和文字描述，为无声视频自动匹配电影级音效。据官方介绍，该模型突破了AI生成视频“有画面无声音”的局限，通过“看懂画面、读懂文字、配准声音”的技术路径，为短视频创作、影视制作、广告创意及游戏开发等领域提供沉浸式视听解决方案。

技术实现层面，混元团队构建了约10万小时级的高质量TV2A数据集，通过自动化标注和过滤技术，使模型具备强泛化能力。该模型可在复杂视频条件下生成音画同步、语义对齐的高品质音频，包括环境音效与背景音乐，显著提升视频真实感。例如输入文字描述“引擎轰鸣加速”或“幼狐爪下落叶沙沙声”，模型即可生成与画面精准匹配的音效。

视频, 模型, 音效, 生成, 混元

相关帖子

回复

使用道具举报

返回列表发新帖

数码小喇叭

社区元老

这位朋友什么都没有写…

主题 1602

精华0

听众0

收听TA 发消息

72小时热榜

分享一个dex2oat加速编译的性能优化方案

OPPO 是怎么让 Android 流畅的？流畅性优化三阶段实施方案

技术讨论

111人已阅读

讲一讲 OPPO 今年新发布的技术：繁星编译器

技术讨论

120人已阅读

来逛ODC2025，进会场人均有德芙丝滑杯~

酒馆杂谈

230人已阅读

激动！来Find X9系列发布会

酒馆杂谈

219人已阅读

热门版块

数码资讯
主题: 3625
漫番资讯
主题: 27
游戏资讯
主题: 638
数码讨论
主题: 179
应用推荐
主题: 65

热门帖子

1

【盖楼抽奖】庆祝社区公测及UID破百，抽送年度最佳入门耳机！

Yangsh888

2025-03-26

2

【盖楼抽奖】庆祝社区App上架，抽送一副头戴耳机！

Yangsh888

2025-04-04

3

【盖楼抽奖】热烈庆祝76周年国庆节&中秋节快乐！

Yangsh888

2025-10-03

4

【盖楼抽奖】粽叶飘香、浓情端午，抽送一个智能音箱！

Yangsh888

2025-05-28

5

达美乐买一送一

oberon

2025-03-31

6

「用户共创」掌机及游戏设置互助系统需求征集与规划设计活动

Yangsh888

2025-05-30

社区热门

1

【盖楼抽奖】庆祝社区公测及UID破百，抽送年度最佳入门耳机！

2025-03-26

2

【盖楼抽奖】庆祝社区App上架，抽送一副头戴耳机！

2025-04-04

3

【盖楼抽奖】热烈庆祝76周年国庆节&中秋节快乐！

2025-10-03

4

【盖楼抽奖】粽叶飘香、浓情端午，抽送一个智能音箱！

2025-05-28

5

达美乐买一送一

2025-03-31

6

《租借女友》动画第四季主视觉图公开，将于2025年7月开播

2025-03-26

最新数码动态，尽在掌握。

关注"NekoTeco"社区

返回顶部

快速回复 返回顶部 返回列表