overfit同步小助手

2024-07-21 11:01:43

ChatTTS超强的真人AI语音助手下载使用教程

简介

ChatTTS是专门为对话场景设计的文本转语音模型，支持多人同时对话，适用的场景非常丰富，比如

LLM助手对话任务

，

视频配音

、

声音克隆

等。同时支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练，功能非常的强大。
文本转语音（TTS）在生活中的应用非常的广泛，比如有声小说、语音导航，视频配音和智能家居控制等。
今天给大家推荐一个超强的TTS文本转语音应用，适用于自然、对话式文本转语音，特别适用于大型语言模型助手的对话任务，以及诸如对话式音频和视频配音等，并且可以免费使用。

教程

1. 下载项目源码

点击进入 chatTTS开源项目地址https://github.com/2noise/ChatTTS
在这里插入图片描述
解压zip文件，安装python sdk python下载地址

2. 安装项目依赖

cmd控制面板进入项目根目录，创建python虚拟环境

执行命令，创建一个名为.venv的虚拟环境：

python -m venv .venv

执行后会在项目根目录下生成一个.venv文件夹
执行安装项目依赖命令，下载安装项目所需要的环境依赖

pip install--upgrade-r requirements.txt

在这里插入图片描述

等待下载安装完成

快速启动

确保在执行以下命令时，处于项目根目录下。

启动 WebUI 可视化界面，执行以下命令：

python examples/web/webui.py

下次启动只用在项目根目录下执行这个命令即可
首次启动会从 https://huggingface.co下载AI语音模型，需要科学上网，过程需要大约20分z左右。

使用教程

启动完成后，会在浏览器里自动打开本地网址。

在这里插入图片描述

如果没有打开，自己在浏览器输入栏，输入网址 http://localhost:8080/

文生音频

在输入文本框内输入你要生成的语音的文字

在这里插入图片描述

选择你想要的音色

在这里插入图片描述
点击生成

会在输出音频框内显示生成的音频，点击下载图标，可以下载音频。

在这里插入图片描述

声音克隆

在采集音频这个上传一段你想要克隆的人物的声音视频，不要出现其他人物的声音和其他杂音，时长一分钟左右即可。
在这里插入图片描述

上传完，在音频代码里面会有你克隆声音的向量代码，复制粘贴，
在这里插入图片描述
把复制的人物语音向量代码粘贴到说话人嵌入里面

然后和文生音频的步骤一样，输入你要合成的文字，点击生成按钮即可获得，某个人得克隆音频。

相关文章推荐

《使用 Xinference 部署本地模型》
《Fastgpt接入Whisper本地模型实现语音输入》
《部署和接入使用重排模型bge-reranker》
《部署接入 M3E和chatglm2-m3e文本向量模型》
《Fastgpt 无法启动或启动后无法正常使用的讨论（启动失败、用户未注册等问题这里）》
《vllm推理服务兼容openai服务API》
《解决vllm推理框架内在开启多显卡时报错问题》

标签：人工智能 ChatTTS TTS

本文转载自: https://blog.csdn.net/weixin_40986713/article/details/140558820
版权归原作者 泰山AI 所有，如有侵权，请联系我们删除。

发表评论

登录后发布评论

“ChatTTS超强的真人AI语音助手下载使用教程”的评论:

还没有评论

关于作者

overfit同步小助手

文章同步

相关阅读

网络安全法-网络运行安全

使用selenium/drissionpage时如何阻止chrome自动跳转http到https

docker desktop 里部署的Open WebUI 管理员密码忘记了的处理方法

在ubuntu20.04中搭建onsite比赛运行环境

利用开源的低代码表单设计器FcDesigner高效管理和渲染复杂表单结构

Kafka学习笔记

【前端】浏览器输入url到页面呈现发生了什么？

文章导航