【C#】Whisper 离线语音识别(微软晓晓语音合成的音频)(带时间戳、srt字幕)...

语音合成&语音识别用微软语音合成功能生成xiaoxiao的语音。用Whisper离线识别合成的语音输出srt字幕。一、语音合成参考这个网址:https://www.bilibili.com/read/cv19064633合成的音频:晓晓朗读-温柔二、Whisper 语音识别下载模型后放入程序

AI虚拟主播数字人技术实现Wav2Lip【附完整版教程】及【效果评测】

本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语音(这里的核心都是人物口型与音频中的语音唇形同步)。主要通过将两个不相关的人的视频、音频,采用Wav2Lip技术,最终得到一个完整的视频文件,且视频的人物口型与音频内容一致。举例:小红的语音、加上小花的自拍视频,融合为一个最终的视频;那么小红在发出

OpenAI开源语音识别模型Whisper在Windows系统的安装详细过程

Windows中部署开源的whisper语音识别软件,可以支持本地部署,可以利用whisper生成字幕文件。whisper对电脑硬件要求不高,既可以使用GPU也可以使用CPU来运算。

【ffmpeg基础】ffmpeg的下载安装

ffmpeg工具的下载和安装的说明

6款强大免费电脑录屏软件,好用给力

提供简洁的用户界面,轻松选择全屏、窗口或自定义区域进行录制。提供丰富的设置选项,如帧率、分辨率、音频设置等。支持云端存储和分享录制的视频,方便与他人协作。提供强大的屏幕录制、音频录制和视频编辑功能。提供丰富的录屏设置选项,如帧率、分辨率等。支持多种录屏方式,如全屏、窗口、区域等。支持多种录屏方式,如

rk3588 ffmpeg使用硬件解码

找到需要的x264 libdrm的pkgconfig文件夹,rockchip_mpp.pc 被安装在了/usr/local/lib/pkgconfig这里。在https://johnvansickle.com/ffmpeg/下载最新的版本然后解压。–host 当前编译工具链的前缀 ll /usr/

ffmpeg安装教程(windows版)

打开“ffmpeg –version”网址,点击下载windows版ffmpeg(点击左下第一个绿色的行)下载完成后解压该压缩包,在斌文件里会有三个exe文件,复制此时的地址。点击新建,将刚复制的地址粘贴添加进去,然后一直点击确定就大功告成啦。在release builds第一个绿框里面选择一个版本

Ubuntu下FFmpeg的安装方式

Ubuntu下FFmpeg的安装方式详细版

本地部署 gpt4free

本地部署 gpt4free

音频 AAC和MP3的帧大小

音频 AAC和MP3的帧大小

Vue中使用vue-video-player插件播放本地mp4视频文件

若依前后端分离版手把手教你本地搭建环境并运行项目:若依前后端分离版手把手教你本地搭建环境并运行项目_霸道流氓气质的博客-CSDN博客_前后端分离项目本地运行在上面搭建项目的基础上,先实现了播放rtmp视频流Vue中使用vue-video-player和videojs-flash插件实现播放rtmp视

大疆无人机基于RTMP服务推流直播

流程:配置nginx服务器--->打开服务器---->配置无人机rtmp地址,将无人机画面推流到服务器上---->运行vlc从服务器上拉取视频流播放。一、下载安装docker容器,docker分为docker engine 和 docker desktop我们安装docker engine就可以了。

Ubuntu 18.04 安装ffmpeg(支持GPU硬件加速)

Ubuntu 18.04 安装ffmpeg(支持GPU硬件加速)-避坑可行

Whisper.cpp 编译使用

是牛人 ggerganov 对 openai 的whisper语音识别模型用 C++ 重新实现的项目,开源在 github 上,具有轻量、性能高,实用性强等特点。这篇文章主要记录在 windows 平台,如何使用该模型在本地端进行语音识别。

前端播放大视频卡顿的解决(m3u8视频流)

前端播放大视频卡顿的解决(m3u8视频流)

【Python】文本转语音库pyttsx3

这个对象将文本以语音播放之前还可以去设置一下它的音量以及语速,而默认使用的是女声播放语音。可以设置合成器来选择语言的年龄、性别和语言等等,这个模式如果直接调用文本转语音的方法去播放的话是不能够识别中文的,所以需要设置一下合成器。以字符串为类型的发音人性别: male, female, or neut

Youtube-dl安装及使用教程(Windows系统)

制作Youtube-dl下载工具

图片、视频修复并超分 - Real-ESRGAN项目使用(一) | 机器学习

前段时间一直在弄golang,很少关注一些开源项目。正巧碰到一个,可以将模糊的照片或者视频修复清晰,且可以超分处理的项目。

Gstreamer 应用开发:1-基础介绍

介绍开始围绕如何用命令实现一个音视频混合,或者单独的音频,和单独的视频文件如何实现播放,并逐步开始使用C语言程序来实现之前我们用命令行来实现的功能

SpringBoot+vue 实现监控视频rtsp播放(java+Nginx+ffmpeg+flv.js)

我使用直接解压的方式可以去nginx官网下载喜欢的nginx版本 ,上传到服务器解压然后编译(这个应该不难,可以使用 make make install )安装完成之后长这样可以看到我这个截图上多了一个 nginx-http-flv-module 这个目录,这个是必要安装的一个模块否则无法

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈