魔音工坊声音混血让你的声音多变动听

看白癜风的医院哪比较好 https://wapyyk.39.net/bj/zhuanke/89ac7.html

阐述各类配音问题,以及“声音混血”的应用、技术和未来想象空间。

配音问题困扰了很多人,用户主要有一些这样的困扰:

1、声音不好听。

2、普通话不标准。

3、没有专业的录音设备和安静的录音环境。

4、找真人配音太贵了。

5、自己配音太麻烦了,还花费时间。

为解决以上这些配音困扰,可以选择使用软件配音,让不同的AI配音员竭诚为你服务。比如人工智能公司出门问问推出AI配音神器——魔音工坊,目前拥有上百种音色可供选择。女主播里,既有御姐,也有萝莉,更有甜美可爱的,也有情感电台风的。男主播里,既有类似毒舌风格的解说员,也有磁性浑厚的,更有支持多种风格的「百变舰长」。

不过对配音而言,目前一个大的场景是段视频配音,除了声音好听,其实还有一个需求是声音能做到个性化,也就是不雷同,有独家特色。为了解决这个问题,魔音工坊也推出了面向用户的声音定制服务。需要合作的自媒体人,既可以选择克隆自己或者朋友的声音,也可以让魔音工坊去帮忙寻找主播。

其中,有一些用户,自身的声音不算太好听或不标准,很自然地会产生“能不能帮我给声音一键美颜?”的需求和想法。也就是说,为自己的声音进行一层“滤镜美颜”,在自身声音的基础上,让用户的声音更专业一些,听着舒服一些,但依然可听出来是自己的声音。

声音「一键美颜」的AI技术原理

我们知道,声音的音色是和人的发音器官相关的,而声音的节奏和韵律等,则是可以后天习得的。读个播音专业,或者是业余参加个配音培训班,都可以改进自己的声音品质。那么,AI技术是否可以帮用户做到「一键美颜」呢?答案是显然的,这个技术就是说话人转换,魔音工坊里,产品功能叫做「声音转换」。

说话人转换(属于voiceconversion技术的一小类),它的功能是把A的说话风格(节奏和韵律等)迁移到B上。转换后的声音,会有B的音色,并拥有A的节奏和韵律等信息。我们尝试给这个功能取了几个不同的名字,大家也可以称之为声音的「移花接木」,「鹦鹉学舌」功能,听名字可能就会「顾名思义」一番,联想到它的功能。

这个功能得益于出门问问的MeetVC技术。同时采用出门问问自研语音识别技术(wenet等),去除发音人音色信息,得到与音色无关的内容信息,经过encoder-decoder(编码-解码)变声模型训练,从而获取目标发音人的音色信息,最终经过声码器得到语音。原理框架图如下所示:

打造DIY的“声音混血”神器

有了声音转换之后,魔音工坊做了几个事情:

1,给魔音工坊自研的一些声音,开发了一些“混血模型”。比如魔音平台最火的男声叫做魔天轮,最火的女声是魔伊莉,我们就会训练两个模型,蒋魔伊莉的节奏嫁接到魔天轮上,让魔天轮保持磁性的音色的同时,也有魔伊莉独有的柔情节奏。

2,面向用户提供“声音混血”服务。如果某位用户的音色不错,只是播音基础不太好,读起来没有很好的节奏。这时候,我们可以让他进棚录制一定的数据,然后魔音训练他的模型,并让用户选择一位他喜欢的主播,从而帮他训练一个混血模型,嫁接某个AI主播专业的节奏感和韵律给他,从而让他的AI声音听起来更舒服,却听着像他。

我们都知道,颜值经济早已经到来。人们未来变得好看,购买各种化妆品、保养、美容,大家都愿意为美付费。而声音和视觉一样,都有着天然的魅力。人们喜欢看好看的帅哥美女,也喜欢听好听的声音。如果某个人拥有惊人的外貌,却天生一把公鸭子嗓,不免会让人心生感叹。因此,我们认为,未来,声音的美容也会成为爱美人士的新需求。如果希望天然的,那就是接受声音的培训,就如同音乐苗子经过培训成长为专业歌手,不好听的声音,经过配音,也会变得更加悦耳。

对于直播、短视频、有声书里的声音,则未来借助技术,如何有效低成本地美化声音,将成为趋势。而说话人转换技术,以及在声音克隆时提供的声音混血服务,必将逐渐流行。正如美容需要参照高颜值明显的五官比例,声音混血则需要采样声音好听(专业的一般比较好听,但是非专业也可能好听)的主播的说话风格和节奏。魔音工坊正在和各路好声音合作(包括知名支持人、主播、配音演员等),构建业界领先的声音商店,从而学习到好声音的各种知识,为更好地提供声音混血服务提供优质样本。

欢迎有独特配音需求的自媒体从业者,有声书主播和魔音工坊合作,通过克隆自己的好声音,或者开发定制美化版本的声音,来提高内容制作过程中的配音效率,为繁荣中国的有声内容添砖加瓦。



转载请注明地址:http://www.1xbbk.net/jwbys/6300.html


  • 上一篇文章:
  • 下一篇文章:
  • 网站简介 广告合作 发布优势 服务条款 隐私保护 网站地图 版权声明
    冀ICP备19027023号-7