文/陈根
美东时间周三,Meta发布了一款开源人工智能(AI)工具AudioCraft,通过AudioCraft,用户就根据文本提示创作音乐和音频。
Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。简单的理解为,就是根据文本内容生成AIGC,只是Meta更侧重于智能语音方向。
这项技术本身并不是新技术,百度较早的时候就已经开始应用。但从目前的实际情况来看,还存在不少问题,比如根据文本生成语音时,还是比较明显的机器感,缺乏人的那种交流表达的情感与语调。
从音乐方向切入,对于Meta而言,是最符合平台娱乐属性,也能增加用户的使用粘性。对于娱乐社交来说,好玩是核心。
而借助于文本能给自己的文字生成音乐或者音频,会增加娱乐趣味性,并且还能让一些可能唱的并不自信的人,也可以为自己生成唱歌的音频进行分享。同时,Meta还可以借机省下一大笔音乐版权费。
不过Meta这项技术的推出,将会带来两个方面的挑战。
一个方面是对音乐行业,包括音乐版权的挑战,当AI拥有了作曲与声音生成能力之后,对于本身就走快餐文化的流行音乐行业将带来冲击;
另一方面就是对用户安全进一步构成影响,尤其是当声音可以根据用户特定音色进行生成的时候,基于声音的一些虚假诈骗是不可忽视的严肃问题。
原文标题 : 陈根:根据文字生成音乐,Meta发布AI新工具?