今天给大家介绍一下基于百度的AI语音技术SDK实现语音合成的案例,编程语言采用Python,希望对大家能有所帮助!
- 注册百度AI平台应用
百度AI开放平台-全球领先的人工智能服务平台
首先登陆自己的百度账户,打开百度的AI开发平台页面
搜索找到离线语音合成,然后点击立即使用,进入百度智能云页面。
创建应用选择语音技术,默认为全部勾选
创建后可以在应用列表可以看到刚刚创建的语音应用。
主要信息是AppID、API Key、Secret Key 这个是自己专属应用的应用id和密钥后面的python代码需要进行配置。
- 编写Python代码
推荐使用pycharm进行代码编写,方面调试和代码格式的检查、以及依赖包导入。
打开pycharm安装依赖包
安装百度语音合成Python依赖
pip install baidu-aip
新建一个speech.py 文件,内容如下:
具体的参数可以参考最新的SDK文档,下面注释写的也比较详细,大家可以看下,应该都可以理解的。
from aip import AipSpeech# 应用IDAPP_ID ='xxxxxxx'# 应用密钥API_KEY ='xxxxxxxxxx'# 安全密钥SECRET_KEY ='xxxxxxxxxxxxxxxxxxx'# 创建语音识别客户端client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 设置语音文本 也可以从本地文件读取Text ='这里是IT技术分享社区,一个有态度的互联网技术交流社区,期待您的加入!'# 设置合成语音的存储路径filePath ='D:\\test.mp3'# 调用客户端方法进行语音生成result = client.synthesis(Text,'zh',1,{'vol':6,# 合成音频文件的准音量'pit':8,# 设置语音的音调 取值为0~9 默认为5'per':0,# 发音人类型 0 女生 1 男生 3 情感合成-度逍遥 4 情感合成-度丫丫,默认为 0 女生,具体的参考官方文档介绍})# 判断是否调用成功ifnotisinstance(result,dict):# 如果调用的成功的话 保存合成的语音文件withopen(filePath,'wb')as f: f.write(result)
然后运行speech.py 文件,可能会报ModuleNotFoundError: No module named 'chardet' 错误
处理办法是安装编码
pip install chardet
安装成功之后的提示如下:
然后再重新运行speech.py
运行成功后可以在D盘找到对应的test.mp3 文件表示运行成功了,
截图如下:
生成的语音文件如下图
以上就是本案例的全部内容了,大家如果有问题的话,欢迎沟通交流!
版权归原作者 IT技术分享社区 所有, 如有侵权,请联系我们删除。