欢迎光临
我们一直在努力

Meta 发布突破性生成式语音系统,一个通用模型解决多项任务

  6月17日,Meta介绍了一种“突破性”的生成式语音系统,它可以合成六种语言的语音,执行噪声消除、内容编辑、转换音频风格等。

Meta 发布突破性生成式语音系统,一个通用模型解决多项任务

  Meta称之为最通用的语音生成AI。Meta表示,Voicebox是第一个没有经过专门针对语音生成的训练,却可以泛化到语音生成任务的模型。与图像和文本的生成一样,Voicebox可以创建多种样式的语音输出,包括从头开始创建输出和修改给定的样本。Voicebox 可以合成六种语言的语音,以及执行噪声去除、内容编辑、风格转换和多样化样本生成。

Meta 发布突破性生成式语音系统,一个通用模型解决多项任务

  Meta表示,Voicebox作为首个能成功执行任务泛化的高效的多功能模型,将开创一个语音生成式AI的新时代。

  但Meta也没有否认这项技术可能被误用乃至被恶意使用。为了应对这种可能性,降低潜在的风险,Meta 还构建了一种分类器,其宣称可有效分辨真实语音和VoiceBox生成的音频。

未经允许不得转载:VR社区 » Meta 发布突破性生成式语音系统,一个通用模型解决多项任务