一句话声音克隆(文字转语音)使用说明

       大家好!一句话声音克隆深受广大用户的喜欢,这里汇总了常见问题,统一答复大家。

一、介绍:

一句话声音克隆是通过克隆这句话的音色并合成新语音,广泛用于文字转语音。能轻松模仿任何人说话,比如模仿《西游记》孙悟空、《三国演义》刘备说话,相识度达95%。

二、入口:

2.1 入口

克隆声音已被滥用,但是仍然有部分人群有需求。请在公众号回复“我要高级功能”,可以开通此功能。


我要高级功能.jpg


2.2 手机入口

点击“配音记录”后,左边菜单能看到一句话克隆,电脑登录是一样的。下面的2.3和2.4也可以在手机上操作。

2.3 电脑入口(适合新手)

登录控制台后,入口在左边菜单,路径:文字转语音 -> 一句话克隆。电脑登录地址:https://deepvoicefix.com/v3/

特点:简单,但是每次合成音频时都要上传参考音频。

2.4 电脑入口(适合老手)

登录控制台后,入口在左边菜单,路径:文字转语音 -> 自定义声音库。点击“创建人物”,进入人物详情后,点击“上传说话感情”,最后在人物详情页点击“一句话克隆”。电脑登录地址:https://deepvoicefix.com/v3/

特点:可以重复使用参考音频。只要合成了一个满意的音频,就可以反复使用这个参考音频。

三、常见问题

3.1 一句话克隆的参考音频有何要求:

参考音频只需3秒左右,因为一句话克隆只需要这句话的音色,能反映出这句话的感情(如愉快,伤心)就行。可以上传音频或视频,如果时间太长,系统会自动截取前6秒。

参考音频要求是:

  • 只有一个人的声音,可以有少量背景音及杂音,不要有第二个人类的声音。

  • 吐字清晰,支持普通话,不支持方言(方言用高清声音库或RVC声音库)。

  • 语速均匀,避免语气词,如嗯、啊、哦,越少越好。




ALI声音库-768x449.webp



3.2 为什么“一句话克隆”长时间都显示“推理中”?

100字内3分钟处理完,1000字5分钟内处理完,5000字10分钟内处理完。

如果出现“失败”,请重新上传参考音频,因为重新上传时,会截取前6秒参考音频,请验证音频文案。参考音频很长可能会导致推理失败。

3.3 为什么“一句话克隆”的声音音量很小?

大概率是参考音频音量小,新合成音频的音量是根据参考音频的音量设置的。同样如果参考音频是“愉快”的语气,那么生成的音频语气也是“愉快”的。参考音频的音量、语速和感情决定了合成的音频。

3.4 666怎么读成六六六吗,而不是六百六十六?

请把666改为汉字六六六。同样如果有多音字,请用同样读音的词语代替。

3.5 一次最多支持多少字?

5000字。

3.6 合成音频的感情不是我想要的?

合成的音频是根据参考音频来的,参考音频如果是很“凶狠”的语气,那么合成的音频也是“凶狠”的。所以如果要“温柔”的语气,请上传“温柔”的参考音频。

3.7 不上传参考音频可以吗?

可以,在“ALI声音库”有许多公开的参考音频,比如《西游记》《三国演义》《小猪佩奇》等系列的人物,可以直接使用。

3.8 有接口吗?

有的,菜单路径:开放平台 -> 克隆声音API。