音视频 - overfit.cn

VUE3开箱即用的音频播放组件（基于原生audio）

注：我是使用unocss语法来编写css 如果项目没有搭载unocss 将其相应的转换为css即可。

overfit同步小助手 2024-09-09 01:03:05 0 收藏

梅尔频谱图（Mel Spectrogram）和梅尔频率倒谱系数（MFCC）

音频信号 -> 预处理 -> 分帧 -> 加窗 -> FFT -> 功率谱 -> 梅尔滤波器组 -> 对数压缩 -> 梅尔频谱图。梅尔频谱图是将音频信号的频谱表示转换到梅尔频率标度上，并通过一组梅尔滤波器对频谱进行加权平均后得到的结果。MFCC：通过对梅尔频谱图的离散余弦变换和压缩，提取了更紧凑和不

overfit同步小助手 2024-09-06 07:01:13 0 收藏

RTSP系列一：RTSP协议介绍

RTSP（Real Time Streaming Protocol），实时流传输协议，是TCP/IP 协议体系中的一个应用层协议，由哥伦比亚大学、网景和RealNetworks 公司提交的IETF RFC 标准。该协议定义了一对多应用程序如何有效地通过IP 网络传送多媒体数据。其语法和操作参考了HT

overfit同步小助手 2024-09-06 03:06:30 0 收藏

后端有一个音频文件，前端 js 请求后端音频接口，接口中音频数据是在outputStream中，给我个案例

以下是一个简单的案例，展示如何在后端提供音频文件数据，并在前端通过 JavaScript 获取并播放该音频。

overfit同步小助手 2024-09-04 19:02:59 0 收藏

ChatTTS文本转语音本地Windows环境部署与远程生成AI音频实战流程

本篇文章主要介绍如何快速地在Windows系统电脑中本地部署ChatTTS开源文本转语音项目，并且我们还可以结合Cpolar内网穿透工具创建公网地址，随时随地远程访问本地搭建的ChatTTS AI语音合成模型。最像人声的AI来了！语音开源天花板ChatTTS火速出圈，一周就斩获20k，目前githu

overfit同步小助手 2024-09-04 13:01:27 0 收藏

m4s是什么文件格式？怎么把m4s文件改MP4？

Mozilla Firefox浏览器支持广泛的视频格式，其主要依赖于HTML5视频播放器和浏览器自身的内置支持Mozilla Firefox浏览器通常支持播放的视频格式有H.264/AVC、VP8、VP9、Ogg Theora、WebM (VP8 或 VP9 编码)、MPEG-4。用户还可以使用Qu

overfit同步小助手 2024-09-02 22:01:51 0 收藏

不同方法降低视频分辨率

第一种方法适合于需要在相同尺寸的显示设备上播放视频，但又希望减小文件大小或降低带宽需求的场景。这种方法保持了视频的播放尺寸，但牺牲了清晰度。第二种方法适用于视频播放器或设备的物理尺寸有限，需要视频占据的空间更小的情况。这种方法不仅降低了清晰度，还改变了视频在屏幕上的物理尺寸。选择哪种方法取决于具体的

overfit同步小助手 2024-09-02 22:01:41 0 收藏

【AI音频处理】：重塑声音世界的无限可能

AI在音频处理领域的应用正以前所未有的速度发展着，它不仅改变了我们与机器的交互方式，也为我们带来了更加丰富多彩的听觉体验。未来，随着技术的不断进步和应用场景的不断拓展，AI在音频处理领域的潜力将被进一步挖掘和释放，为我们的生活带来更多惊喜和便利。让我们共同期待这个充满无限可能的未来吧！

overfit同步小助手 2024-09-02 11:01:10 0 收藏

从图像到视频：Web Codecs API编码技术解析

本文深入探讨了Web Codecs API中的编码技术，从视频编码的基础概念到实际编码过程，详细介绍了如何使用VideoEncoder类进行视频压缩，并通过MP4Box.js封装成视频文件，为开发者提供了实用的编码指南和实践技巧。

overfit同步小助手 2024-09-01 19:02:48 0 收藏

WebRTC音视频开发读书笔记（四）

WebRTC中，连接是核心内容，通过RTCPeerConnection接口可以将本地流MediaStream发送至远端，同时也可以远端媒体发送至本地，从而建立对等连接。本地与远端之间进行媒体协商及网络协商成功后，将本地媒体流发送到远端的过程称为连接建立。

overfit同步小助手 2024-08-31 00:03:05 0 收藏

图生视频，Stable Diffusion WebUI Forge内置SVD了！

之前SVD还不能集成到Stable Diffusion WebUI中，用起来比较不方便。现在Forge解决了这个问题，并且支持最新的1.1模型，这篇文章就来简单介绍下。

overfit同步小助手 2024-08-30 19:04:27 0 收藏

AI视频生成本地搭建图文详细过程

在自己的电脑上搭建一个AI，主要用于通过自己输入的关键字来自动生成视频文案，把视频文案自动生成视频，再自动给视频配音配字幕。

overfit同步小助手 2024-08-29 21:01:20 0 收藏

【论文精读】 | 基于图表示的视频抑郁症识别的两阶段时间建模框架

多尺度面部行为的重要性，抑郁特征增强（DFE）模块，以及两种图编码策略：顺序图表示（SEG）和谱图表示（SPG）

overfit同步小助手 2024-08-26 02:01:24 0 收藏

C# VideoCapture 多路视频播放

overfit同步小助手 2024-08-24 20:01:40 0 收藏

Video视频抽帧和WebCodecs API视频抽帧介绍

视频文件是一个容器，里面有很多不同的轨道信息。如：图像、声音、字幕等。而视频图像信息又是由一系列图片序列帧的集合。如10秒的视长，假设每秒30帧。那大概有300条图像数据。像下面通过mp4box可以一次性得到整个videoTrack的samples数据，再转换为EncoderVideoChunk,通

overfit同步小助手 2024-08-22 14:03:03 0 收藏

以FLV解复用为例详解开源库FFmpeg中解复用器的源码逻辑及处理流程

本文以FLV音视频解复用为例，详细讲解开源库FFmpeg中解复用器的源码逻辑及处理流程。

overfit同步小助手 2024-08-21 08:04:08 0 收藏

电脑缺少dll文件怎么解决？10款dll修复工具大盘点，赶紧收藏起来！

电脑缺少dll文件怎么解决？DLL（动态链接库）是一种重要文件，包含了一系列指令，用于运行几乎所有 Win10、Win8和 Win7的程序。如果Windows 操作系统中缺少DLL文件，您可能会无法启动所需的程序或应用。在 Win10中，最常见的缺失 DLL 文件错误之一是MSVCP110.dll，

overfit同步小助手 2024-08-20 08:05:42 0 收藏

《AI视频类工具之十——D-ID》

D-ID是一个人工智能生成的视频创建平台，可以轻松快速地从文本输入中创建高质量、高性价比和引人入胜的视频，背后的Al技术是由Stable Difusion和GPT.3提供支持，可以在没有任何技术知识的情况下输出100多种语言的视频。D-ID的实时人像功能可以从一张照片中创建视频，虚拟口播主持可以提供

overfit同步小助手 2024-08-19 12:05:44 0 收藏

扒带神器AI音频转MIDI音频伴奏人声乐器分离RipX DAW PRO ,地表最强

RipX DAW Pro是一款功能强大、创新前沿、易于使用的数字音频工作站，它可以让您对音乐进行全方位的控制和创作，无论您是专业的音乐制作人，还是业余的音乐爱好者。RipX DAW 会自动分析素材的速度甚至是和弦、音符的震动细节等等，RipX DAW Pro是一款基于人工智能的数字音频工作站，也可以

overfit同步小助手 2024-08-19 07:01:36 0 收藏