小米技术刚刚发布并且开源了可控视频音效生成模型ControlFoley,统一支

逆铭来聊汽车 2026-05-29 17:23:09

小米技术刚刚发布并且开源了可控视频音效生成模型 ControlFoley,统一支持文本引导视频配音、文本控制视频配音和参考音频控制视频配音三类任务,在多个视频音效生成任务上达到开源SOTA表现。

0 阅读:0
逆铭来聊汽车

逆铭来聊汽车

感谢大家的关注