声音克隆 AI是一类人工智能技术,主要用于生成人类或动物的声音,或将一个人的声音模拟成另一个人的声音。
目前主要的声音克隆 AI有以下几种:
- WaveNet:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。
- Tacotron:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。
- Deep Voice:由Baidu开发的声音克隆 AI模型,能够生成人类的语音。
- Lyrebird:开源的声音克隆 AI模型,能够将一个人的声音模拟成另一个人的声音。
- VCTK:一个开源的语音数据集,其中包含了109个人的语音数据,可以用来训练声音克隆 AI模型。
- VoiceLoop:由Facebook AI Research开发的声音克隆 AI模型,能够生成人类的语音。
- VoiceForge:由SRI International开发的声音克隆 AI模型,能够生成人类的语音。
- Voice cloning toolkit:一个开源的声音克隆工具包,可以用来训练声音克隆 AI模型。
- Real-Time-Voice-Cloning:一个开源的声音克隆工具包,可以用来生成人类语音。
- OpenVocoder:一个开源的语音合成和声音克隆 AI模型,可以用来生成人类语音。
- DeepSinger:由清华大学开发的声音克隆 AI模型,能够生成人类的语音。
- Lyrebird AI:声音克隆 AI模型,能够生成人类的语音。
- Google DeepMind WaveNet:一种基于深度学习的声音克隆 AI模型,能够生成人类语音。
- VocaliD:声音克隆 AI模型,能够生成人类语音。
- Voice-Cloning:声音克隆 AI模型,能够生成人类语音。
- Adobe Voco:声音克隆 AI模型,能够生成人类语音。
其中,很多公司都在研究声音克隆技术,可能会有新的声音克隆 AI模型出现,并取得新的进展。
本文转载自: https://blog.csdn.net/weixin_41429382/article/details/128779226
版权归原作者 百态老人 所有, 如有侵权,请联系我们删除。
版权归原作者 百态老人 所有, 如有侵权,请联系我们删除。