人工智能语音识别

Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战（超详细附源码）

overfit同步小助手 2023-07-17 19:02:01 0 收藏

5个免费、免注册且无时长限制在线语音转换文本网站分享（收藏）

今天达芬奇分享的上述五个网站，都可以实现自由免费免注册语音至文字转换，操作步骤简单明了，结合以往几期分享的文字转语音方法，基本可以满足文字语音自由转换需求，希望大家能够得心应手。Speechtexter是一个纯粹的语音转文字网站，界面非常简单，如下图所示，网站比较独特的是：还支持对转换后的文字的简单

overfit同步小助手 2023-07-13 01:02:05 0 收藏

你需要了解的6大AI音频生成工具

深入了解风靡整个行业的前 6 名 AI 音频生成工具。从语音合成器到音乐作曲家，发现这些工具令人印象深刻的功能，并通过音频制作的未来释放您的创造力。在这篇综合博客文章中了解更多信息。

overfit同步小助手 2023-07-09 15:02:12 0 收藏

OpenAI的人工智能语音识别模型Whisper详解及使用

拥有ChatGPT语言模型的OpenAI公司，开源了 Whisper 自动语音识别系统，OpenAI 强调 Whisper 的语音识别能力已达到人类水准。Whisper是一个通用的语音识别模型，它使用了大量的多语言和多任务的监督数据来训练，能够在英语语音识别上达到接近人类水平的鲁棒性和准确性。Whi

overfit同步小助手 2023-07-06 21:02:04 0 收藏

FreeSwitch采用mrcp协议对接科大讯飞asr和tts以及对话系统

FreeSwitch采用mrcp协议对接科大讯飞asr和tts对接过程

overfit同步小助手 2023-07-06 15:01:59 0 收藏

深度学习应用-WeNet语音识别实战01

WeNet声音转文字Python应用案例

overfit同步小助手 2023-07-02 14:01:49 0 收藏

离线语音交互技术路线之语音合成(TTS)篇

本篇文章主要先从整体上分析了离线语音交互的技术实现路线，以及每个环节可能用到的参考技术，然后详细阐述了其中一个环节：语音合成（TTS）的实现方案。

overfit同步小助手 2023-07-02 01:02:08 0 收藏

LU_ASR01语音模块使用

语音识别一共8个I/O，1路串口TXD，1路传感器接口。其中I/O1-I/O6可以输出PWM信号，I/O7、I/O8不能输出PWM信号。DHT接口可接DHT11模块或DS18B20模块，对应的软件上要选对传感器型号和播报类型。DHT11只能选温湿度进行播报，DS18B20只能选择温度进行播报。...

overfit同步小助手 2023-07-01 18:01:40 0 收藏

AI智能助手的未来：与人类互动的下一代人工智能技术

⭐智能助手是一种基于人工智能技术的应用程序或设备，旨在帮助用户完成各种任务、提供信息和服务。智能助手通常具备语音识别自然语言处理和机器学习等技术，使其能够理解和解释用户的指令问题或请求，并以相应的方式作出回应。📱智能助手可以运行在智能手机、智能音箱、智能手表等设备上，我们日常接触的 Siri、小度

overfit同步小助手 2023-06-30 08:02:02 0 收藏

【通信原理实验】基于A律13折线的PCM编码与解码（附完整代码）

PCM，Pulse Code Modulation（脉冲编码调制），即把从模拟信号抽样、量化、编码成为二迚制符号的基本过程，称为脉冲编码调制。

overfit同步小助手 2023-06-30 00:02:06 0 收藏

语音编码技术，AMR、AMR-NB、AMR-WB、EVS总结

最近对实时语音编码技术有点兴趣，于是了解了一下。一开始听说AMR-NB窄带编码，搜索才发现更多的编码技术，这里总结一下，便于日后查看。一、什么是AMR、AMR-WB全称Adaptive Multi-Rate和Adaptive Multi-Rate Wideband，主要用于移动设备的音频，压缩比比较

overfit同步小助手 2023-06-28 20:02:08 0 收藏

【C#】Whisper 离线语音识别（微软晓晓语音合成的音频）（带时间戳、srt字幕）...

语音合成&语音识别用微软语音合成功能生成xiaoxiao的语音。用Whisper离线识别合成的语音输出srt字幕。一、语音合成参考这个网址：https://www.bilibili.com/read/cv19064633合成的音频：晓晓朗读-温柔二、Whisper 语音识别下载模型后放入程序

overfit同步小助手 2023-06-26 17:02:23 0 收藏

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践，复刻《遥远的歌》，原唱晴子(Python3.10)

忽如一夜春风来，亚洲天后孙燕姿独特而柔美的音色再度响彻华语乐坛，只不过这一次，不是因为她出了新专辑，而是人工智能AI技术对于孙燕姿音色的完美复刻，以大江灌浪之势对华语歌坛诸多经典作品进行了翻唱，还原度令人咋舌，如何做到的? 本次我们借助基于Python3.10的开源库so-vits-svc，让亚洲

overfit同步小助手 2023-06-24 16:02:09 0 收藏

【计算机视觉】数字图像处理（六）—— 图像压缩

数字图像处理（六）—— 图像压缩一、图像压缩概述（一）、图像编码技术的研究背景1. 信息信息传输方式发生了很大的改变2. 图像传输与存储需要的信息量空间（1）彩色视频信息（2）传真数据图像通信系统模型图像冗余无损压缩的原理（四）、图像压缩与压缩的必要性二、图像压缩的保真度准则与压缩性能参数三、统计

overfit同步小助手 2023-06-22 09:02:02 0 收藏

技术解读 | 科大讯飞语音技术最新进展之二：语音识别与语音合成

语音合成技术助力智能硬件升级。

overfit同步小助手 2023-06-21 23:02:20 0 收藏

神仙工具集合

overfit同步小助手 2023-06-21 21:02:08 0 收藏

TTS | 语音合成常见数据集及数据格式详情

本文主要是介绍了语音合成中最常见的数据集（包含各个语种），及其格式等。

overfit同步小助手 2023-06-15 15:02:12 0 收藏

有什么开源的python汉语语音转文字项目？

推荐了十款Python开源的汉语语音转文字项目.

overfit同步小助手 2023-06-15 09:01:58 0 收藏

不限次数的chatGPT

通过预测最可能的下一个单词或短语，ChatGPT可以生成连贯、流畅的语言输出，从而与人类进行自然的交互。此外，ChatGPT还支持生成多样化的输出，这意味着它可以生成不同的回答来应对相同的输入，从而增强了其可用性和逼真程度。它不仅能够帮助用户解决问题、提供信息，还能够提供情感支持和娱乐服务。总之，C

overfit同步小助手 2023-06-10 08:01:50 0 收藏

ChatGPT- OpenAI 的模型(Model) 介绍

随着模型的不断升级，GPT模型的语言生成能力和应用场景也在不断扩展，为多个领域提供更加智能、高效和便捷的解决方案。与传统的图像生成模型相比，DALL·E模型可以生成更加丰富和多样化的图像，同时还可以生成符合逻辑和语义的图像。它可以为用户提供更加便捷和高效的语音控制和交互方式，同时也可以为企业提供更加

overfit同步小助手 2023-06-05 21:01:38 0 收藏