【框架地址】
https://github.com/modelscope/FunASR
【简单介绍】
FunASR是一个功能全面的语音识别工具包,支持多种预训练模型的推理和微调,提供高精度和高效能的语音识别服务。结合PyAudio库,可以实现电脑本地麦克风实时语音识别项目。
该项目首先通过PyAudio库捕获麦克风输入的音频数据,PyAudio是一个跨平台的音频I/O库,可以方便地访问麦克风等音频设备。捕获的音频数据经过预处理,包括降噪、去除回声等,以提高识别准确率。
随后,使用FunASR中的实时语音识别模型(如Paraformer-zh-streaming)对预处理后的音频数据进行处理。这些模型能够实时地将音频数据转换为文本信息,支持中文等多语言识别。
在识别过程中,FunASR还提供了语音端点检测(VAD)功能,自动检测语音片段的开始和结束,以提高识别效率。同时,还可以添加标点恢复(PR)功能,为识别结果添加标点符号,提升可读性。
最终,识别结果会实时显示在界面上,用户可以通过界面实时查看和编辑识别结果。整个项目流程简洁高效,为实时语音识别应用提供了有力支持。
【测试环境】
anaconda3+python3.9
torch==2.0.1+cu117
funasr==1.1.4
modelscope==1.16.1
PyAudio ==0.2.14
【调用代码】
from FunasrManager import *
fm = FunasrManager()
fm.start()
while True:
time.sleep(0.2)
【视频演示】
基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现_哔哩哔哩_bilibili【测试环境】anaconda3+python3.9torch==2.0.1+cu117funasr==1.1.4modelscope==1.16.1PyAudio ==0.2.14更多信息参考:https://blog.csdn.net/FL1623863129/article/details/140764071, 视频播放量 1、弹幕量 0、点赞数 0、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者 未来自主研究中心, 作者简介 未来自主研究中心,相关视频:和阿宝去黑子家玩儿咯,【全站最全SD教程】零基础入门到精通SD教程 附带秋叶大神Stable Diffusion安装包 人工智能AIGC绘图 AI绘图 一键出,开源免费的FunASR实时语音识别模型,手把手教你部署和使用,yolox+bytetrack+pyqt5实现目标追踪结果演示,基于yolo-nas+deepsort实现目标追踪视频演示,跪了!GitHub标星122K!!百星仓库—程序界的封神之作 project based learning,自学编程学习指南!,基于tkinter的GUI选择图片选择视频选择摄像头,将yolov8封装成一个类几行代码完成语义分割任务,[暑假大作战]永久免费的云电脑,使用yolov7的onnx模型部署在C#的winform界面开发程序上https://www.bilibili.com/video/BV1Pb42177Bw/?vd_source=989ae2b903ea1b5acebbe2c4c4a635ee 【源码下载】
版权归原作者 FL1623863129 所有, 如有侵权,请联系我们删除。