overfit同步小助手

2024-07-29 06:01:20

【OpenVoice】AI语音大模型，录制声音即可定制音色

在这里插入图片描述
OpenVoice是一款创新的开源语音克隆与生成技术，它通过先进的深度学习算法，特别是基于Transformer结构的文本转语音（TTS）模型，实现了高精度的音色克隆和灵活的语音风格控制。该技术不仅能够在多种语言和口音中生成语音，还具备零样本跨语言声音克隆的能力，为语音合成领域带来了重大突破。OpenVoice原生支持多种语言，如英语、西班牙语、法语、中文、日语和韩语等。这种多语言支持能力使得OpenVoice在全球范围内具有广泛的应用前景。

下载和使用

搭建环境

安装python和anaconda openvoice指定使用Python 3.9版本解析器，如果已经下载了其他版本的Python也没事，可以下载anaconda适配（anaconda 下载国内好像有点慢，如果需要安装包，在文末可以看到。只提供windows版本）安装成功后需要配置环境变量配置pip conda 国内镜像

# 添加清华大学镜像站频道
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
# 添加频道后需要显示频道
conda config --set show_channel_urls yes# 查询已存在的频道
conda config --get channels

##############pip################ 配置使用清华镜像源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 配置信任该镜像源
pip config set install.trusted-host pypi.tuna.tsinghua.edu.cn

升级pip

python -m pip install--upgrade

安装ffmpeg 到官网下载6.11版本，并配置环境变量（这玩意国内下载也很慢，如果需要安装包，在文末可以看到）

在这里插入图片描述
3. 安装vscode
直接在官网下载就可以了
下载完毕后，需要下载python extension

下载源码如果你有git 去到要保存的文件夹选择git bash here

直接使用git clone https://github.com/myshell-ai/OpenVoice.git 等待下载完成就可以了

如果没有，直接去官网下载源码压缩包就可以了
在这里插入图片描述

VSCode添加Jupyter扩展输入Jupyter搜索，安装第一个即可，会自动安装附带扩展。
选择Python解析器新建虚拟环境

在这里插入图片描述
选择"Venv"

选择3.9python

6. 安装所需插件

点击OK。过程需要些时间，耐心等待VSCode安装完成。

如果出现意外则需要打开控制台重新安装插件pip install -r requirements.txt

在这里插入图片描述
需要注意的是如果出现 (.venv) 说明激活成，如果没有则需要重新激活

.\.venv\Scripts\activate

安装ipykernelpip install ipykernel 用以激活虚拟环境
安装ipywidgetspip install ipywidgets

用于数据分析

下载checkpoints（需要梯子，无法下载checkpoints可以在文末获取）官网点击下载 checkpoints包含中文ZH和英文EN两种语言的模型处理文件。解压后放到openvoice文件夹下

模型使用

点击左侧文件demo_part1.ipynb，然后点击右侧红框部分选择虚拟环境
选择Python Environments 可以用conda替代
点击所有出现的三角右侧为此次执行的虚拟环境
执行完后可以看到这里的output_source有对应的语音中文配置

如果要配置自己想要的音色，可以把录音文件复制到resources,替换如下图的MP3文件为自定义的录音文件例如：
在这里插入图片描述

demo_part_02需要api_key

在这里插入图片描述
作者经费有限，就没试过啦

相关文件获取

工重号发送【openvoice】即可获得
关联文章
在这里插入图片描述

标签：人工智能 python

本文转载自: https://blog.csdn.net/weixin_43946529/article/details/140421504
版权归原作者 不爱飘柔爱霸王 所有，如有侵权，请联系我们删除。

发表评论

登录后发布评论

“【OpenVoice】AI语音大模型，录制声音即可定制音色”的评论:

还没有评论

关于作者

overfit同步小助手

文章同步

相关阅读

网络安全法-网络运行安全

使用selenium/drissionpage时如何阻止chrome自动跳转http到https

docker desktop 里部署的Open WebUI 管理员密码忘记了的处理方法

在ubuntu20.04中搭建onsite比赛运行环境

利用开源的低代码表单设计器FcDesigner高效管理和渲染复杂表单结构

Kafka学习笔记

【前端】浏览器输入url到页面呈现发生了什么？

文章导航