一文读懂“生成式 AI”

人工智能是关于赋予机器以模拟人类智能的能力的广泛领域。它涉及使计算机系统能够执行类似于人类智能的任务,如语音识别、图像识别、自然语言处理和决策制定等。人工智能旨在使机器具备像人类一样的推理、学习、问题解决和决策能力。机器学习是人工智能的一个分支,它是通过数据和统计模型来让机器自动学习和改进的一种方法

SU-03T语音模块的使用(持续更新)

我们在实现各种电路中,肯定会使用到开关这种器件。开关可以是按键,可以是矩阵键盘。但是如果我们用的是语音模块作为开关,可以让自己的产品显得更加高逼格。本博客用于记录本人准备省电子设计大赛过程中使用的SU-03T的语音模块,使用智能公元的开发网页,博客持续更新,小白向。用你的搜索引擎搜索智能公元:智能公

华为云,人工智能入门开发认证试题和答案,HCCDA,AI

人工智能入门级开发者认证HCCDA – AI,考试题目,理论部分

【Python】文本转语音库pyttsx3

这个对象将文本以语音播放之前还可以去设置一下它的音量以及语速,而默认使用的是女声播放语音。可以设置合成器来选择语言的年龄、性别和语言等等,这个模式如果直接调用文本转语音的方法去播放的话是不能够识别中文的,所以需要设置一下合成器。以字符串为类型的发音人性别: male, female, or neut

传统语音增强——基本的维纳滤波语音降噪算法

传统语音增强——基本的维纳滤波语音降噪算法

基于ARM树莓派实现智能家居:语音识别控制,Socket网络控制,火灾报警检测,实时监控

● 语音模块识别语音来控制各个灯的开关,基于串口通信来配置语音命令的内容。● 搭建TCP服务器,用socket网络通信的方式控制各个灯的开关,手机客户端发送指令到电脑服务器端来实现控制功能。● 火灾报警,火焰检测模块结合蜂鸣器开发。接收火焰状态,检测有火源靠近时,蜂鸣器输出低电平发出警报声响,并在终

语音识别智能家居控制设计

技术规格书设计1.本设计采用LD3320语音识别芯片。2.LD3320识别语音后,单片机根据语音控制家电设备开关。3.家电设备有灯、窗帘、空调、热水器。4、家居环境监测传感器有火焰传感器、烟雾传感器、温湿度传感器、人体红外传感器。5、当火焰传感器、烟雾传感器、异常时,启动喷水设备。6、语音控制灯开关

声纹识别之说话人验证speaker verification

由于工作需要接触到了语音领域的声纹识别,对语音识别进行了一些预研,因此在这里开一篇博客,聊一聊speaker verification学习历程。

【SU-03T离线语音模块】:学习配置使用

语音识别模块是在一种基于嵌入式的语音识别技术的模块,主要包括语音识别芯片和一些其他的附属电路,能够方便的与主控芯片进行通讯,开发者可以方便的将该模块嵌入到自己的产品中使用,实现语音交互的目的。离线语音模块 与 在线语音模块的区别:相同点:都可以根据开发人员的需求进行开发相应的固件程序。不同点:离线语

目前全球生成数字人有哪些开源的项目?

OpenAvatar是一个开源的数字人形象框架,能够帮助用户创建和部署高度可定制的数字人和虚拟形象。其目标是通过提供一组标准接口和现成的实现,使得开发人员能够快速轻松地构建出具有不同形态和功能特性的数字人。OpenAvatar的主要特点包括:多样性:OpenAvatar不仅支持不同的机器人和虚拟人物

语音增强——基本谱减法及其python实现

语音增强——基本谱减法及其python实现

Python 语音转文本

Python 文本转语言

基于so-vits-svc语音模型实现AI翻唱歌曲

使用so-vits-svc模型训练zutomayo的音色,让AI用这音色去翻唱其他歌曲

理解梅尔频谱(mel spectrogram)

语音处理中 常常需要用到mel spectrogram,比如在语音分类中常常会把把信号signal变成图片spectrogram的形式, 然后用分类图片的算法(比如CNN)来分类语音。 本文主要介绍如何通过librosa来获取spectrogram 和mel spectrogram

声音克隆 AI有哪些?

Tacotron:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。WaveNet:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。声音克隆 AI是一类人工智能技术,主要用于生成人类或动物的

【愚公系列】华为云系列之ModelArts搭建中文语音识别系统

ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。“一站式”是指AI开发的各个环节,包括数据处理、算法开发、模型训练、模型部署都可以在ModelArts

微软提出AIGC新“玩法”,图灵奖得主Yoshua Bengio也来了!

在AIGC取得举世瞩目成就的背后,基于大模型、多模态的研究范式也在不断地推陈出新。微软研究院作为这一研究领域的佼佼者,与图灵奖得主、深度学习三巨头之一的Yoshua Bengio一起提出了AIGC新范式——Regeneration Learning。这一新范式究竟会带来哪些创新变革?本文作者将带来他

代码会说话——pyttsx3简介

目录一、pyttsx3 概述二、pyttsx3的安装三、pyttsx3的运用四、全套代码一、pyttsx3 概述代码会说话:pyttsx3是Python中的文本到语音转换库。二、pyttsx3的安装pipinstallpyttsximage-20220429155835751三、pyttsx3的运用

中文语音识别数据集总结

目录OpenSLR国内镜像1.Free ST Chinese Mandarin Corpus2.Primewords Chinese Corpus Set 13.爱数智慧中文手机录音音频语料库(Mandarin Chinese Read Speech )4.THCHS305.ST-CMDS6.MAG

CGB2108day17

一、设计模式概念:是一些前人总结出来的值得学习的编程"套路",设计模式一共有23种单例设计模式:确保代码中本类的实例只有一个实现思路:方案一:饿汉式1)把本类的构造方法私有化—为了不让外界调用构造函数来创建对象2)通过本类的构造方法创建对象,并把这个对象也私有化,为了防止外界调用3)提供一个公共且静

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈