语音识别 - overfit.cn

华为云，人工智能入门开发认证试题和答案，HCCDA，AI

人工智能入门级开发者认证HCCDA – AI，考试题目，理论部分

overfit同步小助手 2023-05-16 11:01:52 0 收藏

【Python】文本转语音库pyttsx3

这个对象将文本以语音播放之前还可以去设置一下它的音量以及语速，而默认使用的是女声播放语音。可以设置合成器来选择语言的年龄、性别和语言等等，这个模式如果直接调用文本转语音的方法去播放的话是不能够识别中文的，所以需要设置一下合成器。以字符串为类型的发音人性别: male, female, or neut

overfit同步小助手 2023-05-15 04:01:33 0 收藏

传统语音增强——基本的维纳滤波语音降噪算法

overfit同步小助手 2023-05-13 16:01:39 0 收藏

基于ARM树莓派实现智能家居：语音识别控制，Socket网络控制，火灾报警检测，实时监控

● 语音模块识别语音来控制各个灯的开关，基于串口通信来配置语音命令的内容。● 搭建TCP服务器，用socket网络通信的方式控制各个灯的开关，手机客户端发送指令到电脑服务器端来实现控制功能。● 火灾报警，火焰检测模块结合蜂鸣器开发。接收火焰状态，检测有火源靠近时，蜂鸣器输出低电平发出警报声响，并在终

overfit同步小助手 2023-05-12 00:06:39 0 收藏

语音识别智能家居控制设计

技术规格书设计1.本设计采用LD3320语音识别芯片。2.LD3320识别语音后，单片机根据语音控制家电设备开关。3.家电设备有灯、窗帘、空调、热水器。4、家居环境监测传感器有火焰传感器、烟雾传感器、温湿度传感器、人体红外传感器。5、当火焰传感器、烟雾传感器、异常时，启动喷水设备。6、语音控制灯开关

overfit同步小助手 2023-05-07 11:01:28 0 收藏

声纹识别之说话人验证speaker verification

由于工作需要接触到了语音领域的声纹识别，对语音识别进行了一些预研，因此在这里开一篇博客，聊一聊speaker verification学习历程。

overfit同步小助手 2023-05-06 12:01:39 0 收藏

【SU-03T离线语音模块】：学习配置使用

语音识别模块是在一种基于嵌入式的语音识别技术的模块，主要包括语音识别芯片和一些其他的附属电路，能够方便的与主控芯片进行通讯，开发者可以方便的将该模块嵌入到自己的产品中使用，实现语音交互的目的。离线语音模块与在线语音模块的区别：相同点：都可以根据开发人员的需求进行开发相应的固件程序。不同点：离线语

overfit同步小助手 2023-05-05 22:01:35 0 收藏

目前全球生成数字人有哪些开源的项目？

OpenAvatar是一个开源的数字人形象框架，能够帮助用户创建和部署高度可定制的数字人和虚拟形象。其目标是通过提供一组标准接口和现成的实现，使得开发人员能够快速轻松地构建出具有不同形态和功能特性的数字人。OpenAvatar的主要特点包括：多样性：OpenAvatar不仅支持不同的机器人和虚拟人物

overfit同步小助手 2023-04-22 22:04:33 0 收藏

语音增强——基本谱减法及其python实现

overfit同步小助手 2023-04-22 05:01:43 0 收藏

Python 语音转文本

Python 文本转语言

overfit同步小助手 2023-04-20 19:01:32 0 收藏

基于so-vits-svc语音模型实现AI翻唱歌曲

使用so-vits-svc模型训练zutomayo的音色，让AI用这音色去翻唱其他歌曲

overfit同步小助手 2023-04-20 18:01:35 0 收藏

理解梅尔频谱（mel spectrogram）

语音处理中常常需要用到mel spectrogram，比如在语音分类中常常会把把信号signal变成图片spectrogram的形式，然后用分类图片的算法（比如CNN）来分类语音。本文主要介绍如何通过librosa来获取spectrogram 和mel spectrogram

overfit同步小助手 2023-04-20 10:01:51 0 收藏

声音克隆 AI有哪些？

Tacotron：由Google开发的声音克隆 AI模型，能够生成人类的语音，并在Google Assistant中使用。WaveNet：由Google开发的声音克隆 AI模型，能够生成人类的语音，并在Google Assistant中使用。声音克隆 AI是一类人工智能技术，主要用于生成人类或动物的

overfit同步小助手 2023-04-13 17:01:42 0 收藏

【愚公系列】华为云系列之ModelArts搭建中文语音识别系统

ModelArts是面向AI开发者的一站式开发平台，提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。“一站式”是指AI开发的各个环节，包括数据处理、算法开发、模型训练、模型部署都可以在ModelArts

overfit同步小助手 2023-04-10 12:01:51 0 收藏

微软提出AIGC新“玩法”，图灵奖得主Yoshua Bengio也来了！

在AIGC取得举世瞩目成就的背后，基于大模型、多模态的研究范式也在不断地推陈出新。微软研究院作为这一研究领域的佼佼者，与图灵奖得主、深度学习三巨头之一的Yoshua Bengio一起提出了AIGC新范式——Regeneration Learning。这一新范式究竟会带来哪些创新变革？本文作者将带来他

overfit同步小助手 2023-04-08 21:01:36 0 收藏

代码会说话——pyttsx3简介

目录一、pyttsx3 概述二、pyttsx3的安装三、pyttsx3的运用四、全套代码一、pyttsx3 概述代码会说话：pyttsx3是Python中的文本到语音转换库。二、pyttsx3的安装pipinstallpyttsximage-20220429155835751三、pyttsx3的运用

overfit同步小助手 2023-04-08 18:01:38 0 收藏

中文语音识别数据集总结

目录OpenSLR国内镜像1.Free ST Chinese Mandarin Corpus2.Primewords Chinese Corpus Set 13.爱数智慧中文手机录音音频语料库（Mandarin Chinese Read Speech ）4.THCHS305.ST-CMDS6.MAG

overfit同步小助手 2023-04-05 16:01:36 0 收藏

CGB2108day17

一、设计模式概念：是一些前人总结出来的值得学习的编程"套路"，设计模式一共有23种单例设计模式：确保代码中本类的实例只有一个实现思路：方案一：饿汉式1）把本类的构造方法私有化—为了不让外界调用构造函数来创建对象2）通过本类的构造方法创建对象，并把这个对象也私有化，为了防止外界调用3）提供一个公共且静

overfit同步小助手 2023-04-04 23:02:38 0 收藏

语谱图（一） Spectrogram 的定义与机理

语谱图就是语音频谱图，一般是通过处理接收的时域信号得到频谱图，因此只要有足够时间长度的时域信号就可。专业点讲，那是频谱分析视图，如果针对语音数据的话，叫语谱图。语谱图的横坐标是时间，纵坐标是频率，坐标点值为语音数据能量。由于是采用二维平面表达三维信息，所以能量值的大小是通过颜色来表示的，颜色深，表示

overfit同步小助手 2023-04-04 23:01:31 0 收藏

基于树莓派的智能家居项目整理

智能家居用到的硬件有：树莓派4B、LD3320语音识别模块、pi 摄像头、继电器组、火焰传感器、蜂鸣器、电磁锁采用了简单工厂模式的一个设计方式。稳定，拓展性更强，在C语言中，因为没有接口、类这一说法，所以这里采用了结构体来“等效替换”。有四个灯，所以我创建了四个灯控制.c程序。每一个程序文件中，都有

overfit同步小助手 2023-04-03 17:02:15 0 收藏