音频 - overfit.cn

VoxCeleb1 数据集下载

VoxCeleb1 是广泛使用的说话人识别、验证数据集。由于是从 YouTube 视频中提取，有比较丰富的噪声。（有空补介绍）如果可以使用谷歌表单和翻译软件应该就可以顺利下载，私下分发数据集有侵权风险。官网如下：VoxCelebhttps://www.robots.ox.ac.uk/~vgg/d

overfit同步小助手 2023-04-04 05:01:39 0 收藏

AI又进化了，声音克隆革命性突破

用AI唱了几首歌

overfit同步小助手 2023-03-31 11:02:06 0 收藏

Linux ALSA驱动之二：声卡的创建流程

对于每个声卡，都需要有一个snd_card结构体来描述。它记录着声卡的信息并管理声卡的所有设备。

overfit同步小助手 2023-03-31 00:08:28 0 收藏

module_platform_driver源码分析

在Linux设备驱动开发使用platform平台驱动模型过程中，在定义且初始化好platform_driver结构体变量以后，我们需要向 Linux 内核注册一个platform 驱动，Linux kernel中有两种方法。

overfit同步小助手 2023-02-18 10:07:32 0 收藏

AD2428W手册解读之操作与配置

A2B总线是高级可编程的，可以处理许多用例。A2B系统很容易配置，基于系统、节点和外设的知识。准确的系统配置可以通过从每个从属服务器单独收集信息来获得。例如，相同的A2B模块可以由不同的供应商提供，每个模块都有独特的寄存器编程要求。一个模块可以使用TDM4作为音频接口，而另一个模块使用TDM8。一个

overfit同步小助手 2023-02-16 18:06:32 0 收藏

Linux ALSA源码分析（基于Linux 5.18）

详细的描述的ALSA驱动框架的分层及各模块的主要作用，现在从源码的角度来分析ALSA驱动。

overfit同步小助手 2023-02-11 08:06:43 0 收藏

Linux ALSA驱动之Platform源码分析（wm8350.c）

Platform驱动的主要作用是完成音频数据的管理，最终通过CPU的数字音频接口（DA〉把音频数据传送给Codec进行处理，最终由Codec输出驱动耳机或者是喇叭的音频信号。在具体实现上，ASoC又把Platform驱动分为两个部分: platform_driver和snd_soc_dai_driv

overfit同步小助手 2023-02-04 08:06:49 0 收藏

Linux ALSA驱动之四：Control设备创建流程源码分析（5.18）

Control接口主要让用户空间的应用程序（alsa-lib）可以访问和控制codec芯片中的多路开关，滑动控件等。对于 Mixer（混音）来说，Control接口显得尤为重要，从ALSA 0.9.x版本开始，所有的mixer工作都是通过control接口的来实现的。ALSA已经为AC97定义了完整

overfit同步小助手 2023-01-31 09:06:40 0 收藏

【Audio音频开发】音频基础知识及PCM技术详解

现实生活中，我们听到的声音都是时间连续的，我们称为这种信号叫模拟信号。模拟信号需要进行数字化以后才能在计算机中使用。目前我们在计算机上进行音频播放都需要依赖于音频文件。那么音频文件如何生成的呢？音频文件的生成过程是将声音信息采样、量化和编码产生的数字信号的过程，我们人耳所能听到的声音频率范围为（20

overfit同步小助手 2023-01-21 11:05:59 0 收藏

Audio基本概念及处理流程

overfit同步小助手 2023-01-21 11:05:49 0 收藏

Linux ALSA驱动之三：PCM创建流程源码分析（基于Linux 5.18）

Linux ALSA驱动之PCM创建流程源码分析

overfit同步小助手 2023-01-04 08:06:52 0 收藏

人工智能：语音识别技术介绍

就是语音识别技术中的识别过程，根据输入的语音信号，然后和训练好的HMM声学模型、语言模型、发音字典建立一个搜索空间，根据搜索算法找到最合适的路径。特征提取：把要分析的信号从最原始信号提取出来，这个阶段主要是对语音的幅度标准化、频响校正、分帧、加窗、始末端点检测等预处理操作，为声学模型提供需要特征向量

overfit同步小助手 2022-12-05 09:14:27 0 收藏

【Audio音频开发】音频基础知识及PCM技术详解

现实生活中，我们听到的声音都是时间连续的，我们称为这种信号叫模拟信号。模拟信号需要进行数字化以后才能在计算机中使用。目前我们在计算机上进行音频播放都需要依赖于音频文件。那么音频文件如何生成的呢？音频文件的生成过程是将声音信息采样、量化和编码产生的数字信号的过程，我们人耳所能听到的声音频率范围为（20

overfit同步小助手 2022-08-04 09:15:59 0 收藏

Python第三方库推荐：pyttsx3

今天要推荐的Python第三方库命名为“pyttsx3”。pyttsx3是一个语音库，通过调用此库，很容易就可以让程序“开口说话”，不仅增强了程序的交互性，还能够给人以一种亲切感。pyttsx3库简单易用，是新手的好选择。安装pyttsx3 安装这一步骤应该不用多说了，进入cmd，输入：pip

overfit同步小助手 2022-05-16 07:45:15 0 收藏

VoxCeleb1 数据集下载

AI又进化了，声音克隆革命性突破

Linux ALSA驱动之二：声卡的创建流程

module_platform_driver源码分析

AD2428W手册解读之操作与配置

Linux ALSA源码分析（基于Linux 5.18）

Linux ALSA驱动之Platform源码分析（wm8350.c）

Linux ALSA驱动之四：Control设备创建流程源码分析（5.18）

【Audio音频开发】音频基础知识及PCM技术详解

Audio基本概念及处理流程

Linux ALSA驱动之三：PCM创建流程源码分析（基于Linux 5.18）

人工智能：语音识别技术介绍

【Audio音频开发】音频基础知识及PCM技术详解

Python第三方库推荐：pyttsx3

作者榜

资讯小助手

内容小助手

Deephub

奕凯