人工智能语音识别

AI语音识别模块--whisper模块

"small"小型化模型: "https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt",查看初始化

overfit同步小助手 2024-02-28 04:01:41 0 收藏

ai智能语音机器人系统的话术怎样设置效果比较好

根据用户的问题，机器人可以直接从知识库中获取相应的回答，提供准确和高质量的解答，有关系统问题欢迎微博主一起交流学习。可以采用上下文感知技术，根据之前的对话和用户个人信息，为用户提供个性化的回答和建议。在遇到无法回答的问题时，要有友好的错误提示，给出解释或提供其他可行的建议。通过收集用户的反馈和数据分

overfit同步小助手 2024-02-22 23:01:39 0 收藏

HarmonyOS鸿蒙基于Java开发: AI语音播报开发

实时语音交互：生成音频信息用于语音交互。例如与智能音箱或手机智能助手的交互，后台会将回答信息以音频方式进行语音播报。超长文本播报：用于小说、新闻等较长文本的自动朗读。

overfit同步小助手 2024-02-19 23:01:23 0 收藏

【 AI 两步实现文本转语音】

简单实现文本合成语音

overfit同步小助手 2024-02-18 07:01:40 0 收藏

基于科大讯飞开放平台、腾讯AI开放平台、百度智能云以及阿里云的语音转文字+文本翻译API调用

overfit同步小助手 2024-02-16 04:01:35 0 收藏

让AI帮你说话--GPT-SoVITS教程

让AI帮你说话--GPT-SoVITS模型合成自己声音

overfit同步小助手 2024-02-08 11:01:36 0 收藏

【人工智能概论】自注意力机制（Self-Attention）

自注意力机制（Self-Attention）

overfit同步小助手 2024-02-05 18:01:44 0 收藏

人工智能-语音识别技术paddlespeech的搭建和使用

PaddleSpeech是百度飞桨（PaddlePaddle）开源深度学习平台的其中一个项目，它基于飞桨的语音方向模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型。PaddleSpeech支持语音识别、语音翻译（英译中）、语音合成、标点恢复等应用示例。

overfit同步小助手 2024-02-01 15:01:47 0 收藏

广西民族大学高级人工智能课程—头歌实践教学实践平台—构建自动语音识别

overfit同步小助手 2024-01-19 17:01:12 0 收藏

Speech | 人工智能中语音质量评估方法详解及代码

本文主要讲解人工智能中语音合成，语音转换，语音克隆等生成语音的一些质量评估方法~

overfit同步小助手 2024-01-18 15:01:35 0 收藏

【小沐学Python】Python实现TTS文本转语音（speech、pyttsx3、百度AI）

TTS(Text To Speech) 译为从文本到语音，TTS是人工智能AI的一个模组，是人机对话的一部分，即让机器能够说话。TTS是语音合成技术应用的一种，首先采集语音波形，然后进行优化处理，最后存储在数据库中，合成语音是提取波形转换成自然语音输出。Windows 语音识别允许你单独通过语音控制

overfit同步小助手 2024-01-13 01:01:39 0 收藏

人工智能与量子计算：开启未知领域的智慧之旅

人工智能量子计算的结合既是科技发展的必然趋势，也是打开计算科学未知领域的一把金钥匙。人工智能与量子计算的结合是科技领域的一场创新盛宴，引领我们进入了探索未知领域的新时代。量子计算与人工智能的结合为科技领域带来了前所未有的机遇，同时也面临着前所未有的挑战。量子计算的崛起为人工智能领域注入了新的活力，开

overfit同步小助手 2024-01-12 16:01:30 0 收藏

【AI视野·今日Sound 声学论文速览第三十九期】Tue, 2 Jan 2024

在 UASpeech 语料库上进行的实验表明，基于 GAN 的数据增强始终优于微调的 Wav2vec2.0 和 HuBERT 模型，在不同的数据扩展操作点上不使用数据增强和速度扰动，字错误率 WER 降低了统计显着性，分别达到 2.01 和 0.96 绝对值 9.03 和4.63 相对于 16 个构

overfit同步小助手 2024-01-12 14:01:35 0 收藏

传统语音增强——最小均方(LMS)自适应滤波算法

overfit同步小助手 2024-01-05 21:01:35 0 收藏

声音信号的A律13折线（格雷码）编码仿真

本课题是点对点无噪通信场景下信源编译、码的应用，对给定声音信号采用A律13折线编码，并对处理过程涉及的不同信号形式进行绘图。

overfit同步小助手 2023-12-26 16:01:09 0 收藏

小白也能听懂的ai音声制作入门教程了！！！

ddsp-3.0是一款ai合成音频的开源项目，与之前的sovits，rvc，diff-svc不同，DDSP在训练推理速度和配置要求上都可以说是全面优于前面几个项目，并且训练效果有sovits4.0的80~90%，效果还是很不错的，只需要一张2G以上显存的N卡，花上一两个小时就可以训练完成，大大降低了

overfit同步小助手 2023-12-22 16:01:41 0 收藏

端到端流式语音识别研究综述——语音识别（论文研读）

语音识别

overfit同步小助手 2023-12-19 20:01:43 0 收藏

语音识别与Python编程实践

语音识别是一门复杂的交叉技术学科，通常涉及声学，信号处理，模式识别，语言学，心理学，以及计算机等多个学科领域。语音识别技术的发展可追寻到20世纪50年代，贝尔实验室首次实现Audrey英文数字识别系统（可识别0——9单个数字英文识别），并且准确识别率达到90%以上。普林斯顿大学和麻省理工学院在同一时

overfit同步小助手 2023-12-19 06:01:45 0 收藏

Wav2Vec & HuBert 自监督语音识别模型

自监督预训练语言模型，wav2vec, wav2vec2.0，HUBert

overfit同步小助手 2023-12-11 17:01:27 0 收藏

【语音识别入门】特征提取（Python完整代码）

给定一段音频，请提取12维MFCC特征和23维FBank，阅读代码预加重、分帧、加窗部分，完善作业代码中FBank特征提取和MFCC特征提取部分，并给出最终的FBank特征和MFCC特征，存储在纯文本中，用默认的配置参数，无需进行修改。抽样时频率不够高，抽样出来的点既代表了信号中的低频信号的样本值，

overfit同步小助手 2023-12-05 01:01:33 0 收藏