Meta 发布突破性生成式语音系统，一个通用模型解决多项任务-VR社区

　　6月17日，Meta介绍了一种“突破性”的生成式语音系统，它可以合成六种语言的语音，执行噪声消除、内容编辑、转换音频风格等。

　　Meta称之为最通用的语音生成AI。Meta表示，Voicebox是第一个没有经过专门针对语音生成的训练，却可以泛化到语音生成任务的模型。与图像和文本的生成一样，Voicebox可以创建多种样式的语音输出，包括从头开始创建输出和修改给定的样本。Voicebox 可以合成六种语言的语音，以及执行噪声去除、内容编辑、风格转换和多样化样本生成。

　　Meta表示，Voicebox作为首个能成功执行任务泛化的高效的多功能模型，将开创一个语音生成式AI的新时代。

　　但Meta也没有否认这项技术可能被误用乃至被恶意使用。为了应对这种可能性，降低潜在的风险，Meta 还构建了一种分类器，其宣称可有效分辨真实语音和VoiceBox生成的音频。

Meta 发布突破性生成式语音系统，一个通用模型解决多项任务

相关推荐

随机推荐

回顶部