当前位置: 首页   经验 >   Meta宣布推出新的人工智能可通过文本生成逼真的音乐和声音

Meta宣布推出新的人工智能可通过文本生成逼真的音乐和声音

Meta宣布推出新的人工智能可通过文本生成逼真的音乐和声音
时间:2023-08-25 11:57:20 来源:互联网


(资料图片)

Meta发布了AudioCraft,这是一个全新的开源人工智能系统,允许用户通过文本提示生成原创音乐、音效和其他音频内容。

该系统由三个不同的人工智能模型组成,经过数千小时的音频数据训练。这些组件包括用于音乐生成的MusicGen、用于生成音效的AudioGen以及帮助训练模型的EnCodec。

MusicGen 可以根据描述情绪、乐器、节奏和其他品质的文本提示创建各种流派的器乐音乐。AudioGen 根据文本描述生成动物噪音、天气、机械声音等声音效果。

关键点是 EnCodec,它学习离散音频标记来为模型创建“固定词汇”。这简化了音频生成人工智能设计。

AudioCraft 系列模型能够产生具有长期一致性的高质量音频,并且易于使用。与该领域之前的工作相比,通过 AudioCraft,我们简化了音频生成模型的整体设计。

这些模型可以帮助游戏开发人员创建声音效果,并帮助营销团队制作商业配乐或效果。

尽管如此,随着人工智能使用他人作品生成的内容激增,围绕版权和补偿的问题仍然存在。

到目前为止,大多数模型都仅限于研究,例如 Google 的 MusicLM。Meta 认为,轻松访问创意音频 AI 将催生新的艺术形式和用例。该框架和模型可用于非商业研究和教育目的。

另一方面,Meta 通过这个项目继续在 AI 领域发展。6 月初,该公司发布了 Voicebox,旨在帮助创作者执行音频编辑、采样和风格化等语音生成任务,即使它没有经过专门的上下文学习训练。

此外,我们报道称,这家科技巨头正在开发各种类人聊天机器人,很快就能与用户交谈。这些聊天机器人可以使用角色来模拟与不同个体的对话。