whisper - overfit.cn

AI生成字幕模型whisper介绍与使用

随着人工智能技术的飞速发展，AI生成字幕模型已成为视频内容创作和传播领域的重要工具。其中，OpenAI推出的Whisper模型以其卓越的性能和广泛的应用场景，受到了广大用户和研究者的关注。本文将详细介绍Whisper模型的基本原理、特点、应用场景以及使用方法，旨在帮助读者更好地了解和运用这一先进技术

overfit同步小助手 2024-12-13 22:01:28 0 收藏

【内网穿透】如何本地搭建Whisper语音识别模型并配置公网地址

OpenAI开源的 Whisper 语音转文本模型效果都说还不错，今天就给大家推荐 GitHub 上一个开源项目 Whisper Web，允许你可直接在浏览器中运行使用 Whisper。基于 ML 进行语音识别，并可通过 WebGPU 进行运行加速，无需后端服务器，直接开箱即用。另外，识别到的文本支

overfit同步小助手 2024-08-02 20:08:17 0 收藏

实战whisper第二天：直播语音转字幕（全部代码和详细部署步骤）

基于Whisper的实时直播语音转录或翻译是一项使用OpenAI的Whisper模型实现的技术，它能够实时将直播中的语音内容转录成文本，甚至翻译成另一种语言。这一过程大致分为三个步骤：捕获直播音频流、语音识别（转录）以及翻译（如果需要）。下面详细解释其原理和意义。

overfit同步小助手 2024-08-02 20:08:12 0 收藏

语音识别模型whisper的参数说明

它是在各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。如果为true，则前一个模型的输出会作为下一个窗口的提示，禁用可能导致窗口之间的文本不一致，但该模型不太容易陷入故障循环。在CPU接口下，torch使用的线程数量，取代 MKL_NUM_THREADS

overfit同步小助手 2024-08-02 20:07:57 0 收藏

Windows系统电脑本地部署语音转文本服务Whisper Web结合cpolar内网穿透远程访问使用

本文主要介绍如何在Windows系统电脑本地部署语音转文本服务Whisper Web结合cpolar内网穿透工具实现远程访问使用

overfit同步小助手 2024-07-03 00:03:04 0 收藏

Whisper开源免费的语音识别：OpenAI如何用AI改变字幕制作与语音理解的未来！

OpenAI在2022年底至2023年初期间发布了Whisper这一项目，它是一个深度学习模型，专为语音识别和翻译任务设计。Whisper不仅支持多种语言（共98种），还声称其英语语音识别的准确性达到了人类水平，这使得它成为一个引人注目的技术突破。

overfit同步小助手 2024-06-26 16:04:12 0 收藏

本地部署Whisper Web结合内网穿透实现远程访问本地语音转文本模型

overfit同步小助手 2024-06-23 08:02:44 0 收藏

【MacOS】openai 语音识别模型 whisper 本地部署教程（cpu+mps方案）

一些艰辛的解决报错历程目前macOS+whisper+mps的文章好像比较少发一个分享一下如果有帮到大家请多多点赞～

overfit同步小助手 2024-06-17 07:04:58 0 收藏

基于Whisper+SparkAI+Pyttsx3实现全流程免费的语音交互

HTTPS 协议：大多数现代浏览器只允许在 HTTPS 协议或localhost上使用摄像头和麦克风等硬件设备。如果你在开发环境中使用 HTTP，可能会遇到为undefined的问题。建议在开发和生产环境中都使用 HTTPS。你可以使用ngrok或serveo.net等工具将本地服务器暴露为 HTT

overfit同步小助手 2024-06-12 19:03:46 0 收藏

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索（三）

通过官方推荐的方法调用OpenAI 开放的Whisper语音识别模型

overfit同步小助手 2024-06-09 14:04:33 0 收藏

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索（一）

学习OpenAI开源的Whisper语音识别模型，帮助用户将语音转换成文本

overfit同步小助手 2024-06-05 13:04:15 0 收藏

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索（二）

学习OpenAI开源的Whisper语音识别模型，并集成FastAPI对外提供语音识别服务

overfit同步小助手 2024-06-05 08:04:18 0 收藏

ChatGPT开源的whisper音频生成字幕

好了，那接下来看一下whisper开源库的介绍有五种模型大小，其中四种仅支持英语，提供速度和准确性的权衡。上面便是可用模型的名称、大致的内存需求和相对速度。如果是英文版的语音，直接想转换为英文。本来我是想直接在我的本地电脑上安装环境的，也就是无非安装python、ffmpeg、以及whisper，但

overfit同步小助手 2024-06-04 19:04:25 0 收藏

OpenAI 开源的免费 AI 语音转文字工具 - Whisper，一步一步本地部署运行

Whisper 是 OpenAI 研发的一个通用的语音识别模型，可以把语音转为文本。它在大量多样化的音频数据集上进行训练，同时还是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别

overfit同步小助手 2024-05-26 04:01:34 0 收藏

超快的 AI 实时语音转文字，比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper

faster-whisper 这个项目是基于 OpenAI whisper 的模型，在上面的一个重写。使用的是 CTranslate2 的这样的一个库，CTranslate2 是用于 Transformer 模型的一个快速推理引擎。在相同精度的情况下，faster-whisper 的速度比 Open

overfit同步小助手 2024-03-29 01:04:07 0 收藏

webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools

官方未提供python的封装绑定，直接调用执行文件提供了源码和Cpython结合的绑定提供了ctype方式的绑定，需要先make libwhisper.so，有更好的类型安全性和性能。

overfit同步小助手 2024-02-24 08:03:08 0 收藏

深度学习系列56：使用whisper进行语音转文字

这应该是最快的使用方式了。安装，接着安装ffmpeg，随后就可以使用了。

overfit同步小助手 2024-02-09 10:06:20 0 收藏

.Net 使用OpenAI开源语音识别模型Whisper

Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络，且它亦支持其它98种语言的自动语音辨识。Whisper系统所提供的自动语音辨识（Automatic Speech Recognition，ASR）模型是被训练来运行语音辨识与翻译任务的，它们能将各

overfit同步小助手 2023-12-31 21:04:32 0 收藏