当你被 OpenAI Sora 生成的视频震撼时,有没有潜意识里总觉得还缺点啥?——没错,声音。一个视频的成功离不开画面效果和声音效果。
最近,AI语音克隆初创公司ElevenLabs为OpenAI Sora创建的视频添加了逼真的背景声音,引起了广泛关注。这款新模型允许用户通过描述所需内容来为视频片段添加声音效果,填补了AI生成内容缺乏背景音频的空白。

(视频链接:https://mp.weixin.qq.com/s/3qHNbqd9d0vE4uw53-YTxw)
ElevenLabs表示,他们正在开发一个新产品,可以根据用户给出的场景描述生成声音,为原本无声的视频片段添加声效。他们使用文本提示来生成各种声音,包括城市喧嚣中的脚步声、海浪声、火车运行时的声音以及人声等。这一举措被认为是对Sora等工具生成内容的有力补充,为用户提供了更加全面的体验。
尽管市场上已经存在一些文本到音效模型,但ElevenLabs的新模型将专注于为视频内容添加声音效果,包括脚步声、波浪声和氛围声等。这一举措被认为是对AI生成内容的重要补充,为视频制作领域带来了新的可能性。
ElevenLabs成立于2022年,由前谷歌机器学习工程师Piotr Dabkowski和前Palantir部署策略师Mati Staniszewski共同创立。他们的新模型可能会给公司带来先发优势,但同时也有其他公司涉足这一领域的潜力。未来,预计会涌现更多能够分析视频内容并正确自动添加声音效果的工具。
随着文本转音效、AI视频和合成语音等技术的进步,AI领域正在逐渐实现通过单一提示创建完整、全面内容的梦想。
© 版权声明
本文转载自互联网,仅供学习交流,内容版权归原作者所有,如涉作品、版权或者其他疑问请点击联系站长处理删除。
相关文章
暂无评论...