🎵 M2UGen融合音乐理解和多模态任务,支持文字、图像、视频生成音乐。
👥 提供多种配音角色选择,包括支持openai的TTS模型。
🔍 技术特点: DreamTalk利用扩散模型生成高质量动画,实现逼真嘴唇动作和丰富表情,支持多语言同步,可用于不同场景和环境。
@Meta研究员Martin Signoux
慕江南,视频号品牌直播先行者
🎵 M2UGen融合音乐理解和多模态任务,支持文字、图像、视频生成音乐。
👥 提供多种配音角色选择,包括支持openai的TTS模型。
🔍 技术特点: DreamTalk利用扩散模型生成高质量动画,实现逼真嘴唇动作和丰富表情,支持多语言同步,可用于不同场景和环境。
@Meta研究员Martin Signoux
慕江南,视频号品牌直播先行者