语音识别 - overfit.cn

通过预测最可能的下一个单词或短语，ChatGPT可以生成连贯、流畅的语言输出，从而与人类进行自然的交互。此外，ChatGPT还支持生成多样化的输出，这意味着它可以生成不同的回答来应对相同的输入，从而增强了其可用性和逼真程度。它不仅能够帮助用户解决问题、提供信息，还能够提供情感支持和娱乐服务。总之，C

overfit同步小助手 2023-06-10 08:01:50 0 收藏

ChatGPT- OpenAI 的模型(Model) 介绍

随着模型的不断升级，GPT模型的语言生成能力和应用场景也在不断扩展，为多个领域提供更加智能、高效和便捷的解决方案。与传统的图像生成模型相比，DALL·E模型可以生成更加丰富和多样化的图像，同时还可以生成符合逻辑和语义的图像。它可以为用户提供更加便捷和高效的语音控制和交互方式，同时也可以为企业提供更加

overfit同步小助手 2023-06-05 21:01:38 0 收藏

【蓝牙音频SoC】BES2700YP、BES2600YP、AB1565A、QCC3056芯片基本介绍

BES2700YP、BES2600YP、AB1565A、QCC3056【蓝牙音频SoC】。

overfit同步小助手 2023-06-03 02:01:46 0 收藏

自动语音识别（ASR）研究综述

慢慢的降语音识别，全部都研究透彻。研究彻底都行啦的理由与打算。

overfit同步小助手 2023-06-01 00:01:37 0 收藏

用 AudioGPT 输入自然语言，可以让 ChatGPT 唱歌了？

夕小瑶科技说原创作者 | 智商掉了一地借助 ChatGPT 强大的理解与生成能力，结合基础语音模型，集成模型 AudioGPT 诞生了！最近基于 ChatGPT 的二创如雨后春笋一样冒出，上周我们一起看了黑客松优秀作品大赏，这周又有新脑洞横空出世。有篇将 ChatGPT 用于语音理解与生成任务的文

overfit同步小助手 2023-05-30 08:01:51 0 收藏

AI测试｜天猫精灵智能音箱测试策略与方法

2014年11月，亚马逊推出了一款全新概念的智能音箱：Echo，这款产品最大的亮点是将智能语音交互技术植入到传统音箱中，从而赋予了音箱人工智能的属性。这个被称为“Alexa”的语音助手可以像你的朋友一样与你交流，同时还能为你播放音乐、新闻、网购下单、Uber叫车、订外卖等等。

overfit同步小助手 2023-05-27 12:01:35 0 收藏

智能语音识别垃圾桶

文章实现了用户口述垃圾名称，对应的垃圾类别自动开合桶盖，实现垃圾分类，增加了乐趣性。

overfit同步小助手 2023-05-27 03:01:47 0 收藏

语音识别系列︱paddlespeech的开源语音识别模型测试（三）

上一篇paddlehub是一些预训练模型，paddlespeech也有，所以本篇就是更新paddlespeech里面的模型。

overfit同步小助手 2023-05-25 16:04:53 0 收藏

ChatGPT：数字时代革新与展望

overfit同步小助手 2023-05-22 16:02:19 0 收藏

现代信号处理——时频分析与时频分布（小波变换）

overfit同步小助手 2023-05-21 23:01:39 0 收藏

Whisper.cpp 编译使用

是牛人 ggerganov 对 openai 的whisper语音识别模型用 C++ 重新实现的项目，开源在 github 上，具有轻量、性能高，实用性强等特点。这篇文章主要记录在 windows 平台，如何使用该模型在本地端进行语音识别。

overfit同步小助手 2023-05-20 20:01:37 0 收藏

一文读懂“生成式 AI”

人工智能是关于赋予机器以模拟人类智能的能力的广泛领域。它涉及使计算机系统能够执行类似于人类智能的任务，如语音识别、图像识别、自然语言处理和决策制定等。人工智能旨在使机器具备像人类一样的推理、学习、问题解决和决策能力。机器学习是人工智能的一个分支，它是通过数据和统计模型来让机器自动学习和改进的一种方法

overfit同步小助手 2023-05-18 00:02:07 0 收藏

SU-03T语音模块的使用（持续更新）

我们在实现各种电路中，肯定会使用到开关这种器件。开关可以是按键，可以是矩阵键盘。但是如果我们用的是语音模块作为开关，可以让自己的产品显得更加高逼格。本博客用于记录本人准备省电子设计大赛过程中使用的SU-03T的语音模块，使用智能公元的开发网页，博客持续更新，小白向。用你的搜索引擎搜索智能公元：智能公

overfit同步小助手 2023-05-16 13:01:36 0 收藏

【C#】Whisper 离线语音识别（微软晓晓语音合成的音频）（带时间戳、srt字幕）...

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践，复刻《遥远的歌》，原唱晴子(Python3.10)

【计算机视觉】数字图像处理（六）—— 图像压缩

技术解读 | 科大讯飞语音技术最新进展之二：语音识别与语音合成

神仙工具集合

TTS | 语音合成常见数据集及数据格式详情

有什么开源的python汉语语音转文字项目？

不限次数的chatGPT