whisper 语音识别AI 声音To文字

是一个由 OpenAI 训练并开源的,功能是语音识别,能把转换为,在英语语音识别方面的稳健性和准确性接近人类水平。1、Whisper支持语音转录和翻译两项功能并接受各种语音格式,模型中、英、法、德、意、日等主流语言上取得85%以上的准确率,完全符合工业准确率标准,未来有望打开商业化空间;2、Whis

了解NVIDAI显卡驱动(包括:CUDA、CUDA Driver、CUDA Toolkit、CUDNN、NCVV)

比如:需要安装TensorFlow2.1(使用GPU),要求我们只能安装CUDATOOLKIT=10.1,那么我们就从7.6.4、7.6.3、7.6.2这三个版本中,选择一个最新的7.6.4版本来安装CUDNN。每个版本的CUDA Toolkit 都对应一个最低版本的CUDA Driver,也就是说

Py之face_alignment:人脸对齐库face_alignment的完整安装与使用攻略

然而,由于面部在不同的姿势、光照条件和表情下会产生许多变化,因此准确的面部对齐仍然是一个具有挑战性的任务。Face Alignment技术的目标就是在更好地描述人脸形状的基础上,实现更精准、更可靠的面部对齐。Face Alignment是对齐人脸上的一些关键点,如嘴唇、眼睛、眉毛等,使得这些点在所有

医学图像的 AI 框架 MONAI 详细教程(一)

最近在读 CVPR 2023 上和医学图像方向相关的论文,发现其中的 Label-Free Liver Tumor Segmentation 这篇论文使用了 MONAI 这个框架。之前关注过的一些医学图像的期刊论文上,也有 MONAI 的出现,加之前的导师有过推荐,所以了解学习了下。简单检索后,发现

Failed to create CUDAExecutionProvider.

Failed to create CUDAExecutionProvider

2023mathorcup本科组C题电商物流网络包裹应急调运与结构优化问题保姆级思路

2023mathorcup本科组C题电商物流网络包裹应急调运与结构优化问题思路

深度学习之 11 空洞卷积的实现

空洞卷积的实现

【深度学习】ONNX 模型文件修改节点的名称,修改输入名称,修改输出名称

想要修改onnx模型文件的节点名称,要么在最初的pytorch代码里去改,要么就直接在onnx模型文件里改。其实修改其他节点的名称也可以这样去做,注意修改的是要关注到前后连接的节点。

【点云检测】OpenPCDet 教程系列 [1] 安装 与 ROS运行

主要是介绍库的使用,做笔记区OpenPCDet和mmdetection3d有什么区别?- 知乎 (zhihu.com)这是OpenMMLab官方的回复:OpenPCDet 和 mmdetection3d 是两个不同的团队开发和维护的。从功能角度上讲,mmdet3d 支持的场景和任务更多(包含室内室外

Pandas字符串操作的各种方法速度测试

由于LLM的发展, 很多的数据集都是以DF的形式发布的,所以通过Pandas操作字符串的要求变得越来越高了,所以本文将对字符串操作方法进行基准测试,看看它们是如何影响pandas的性能的。因为一旦Pandas在处理数据时超过一定限制,它们的行为就会很奇怪。

第十四届中国大学生服务外包大赛细品,巧用AI共克“记账”难题

前言熟悉我的小伙伴应该知道我在大学时期参与了很多竞赛,我向来对比赛是比较热枕的,以我个人观点,我认为可以通过竞赛激发学习激情和检验自己的技能水平掌握情况,大学生很少有机会能够了解到课堂之外市场的需求,外包服务竞赛就是一个很好的机会能够帮助大学生接触到市场需要何种服务以及人才需求,而且大学的很多比赛都

『吴秋霖赠书活动 | 第一期』《强化学习:原理与Python实战》

『吴秋霖赠书活动 | 第一期』《强化学习:原理与Python实战》

【K210】K210学习笔记二——image

本文着重于 image 模块中的一个函数 find_blobs 也就是寻找色块的函数,因为多次比赛使用下来,给我的感觉就是 image 模块中最好用的便是寻找色块这个函数。其他的函数做的都比较差(个人感觉),比如识别形状的那几个函数,但其实找色块也是可以识别形状的。我这两年来做无人机题的识别都靠的是

pytorch对网络层的增加,删除,变更和切片

今天在这里纪录一下如何对torch网络的层进行更改:变更,增加,删除与查找这里拿VGG16网络举例,先看一下网络结构。

【数据集处理】制作自己的tusimple数据集(图森数据集)(LaneNet模型数据集)

数据制作图森数据集(tusimple),tusimple数据集LaneNet模型的标准数据集,便于后期实现基于LaneNet模型的车道线检测。

知识图谱入门:使用Python创建知识图,分析并训练嵌入模型

本文中我们将解释如何构建KG、分析它以及创建嵌入模型。

公开 学生课堂行为数据集 SCB-Dataset Student Classroom Behavior dataset

公开 学生课堂行为数据集 SCB-Dataset Student Classroom Behavior dataset

Mask RCNN训练自己的数据集

Mask RCNN训练自己的数据集,有源码和数据集提供

Mask图像与json文件相互转换

做机器学习处理图像时,需要标注图像,其中一种标注是标出图像中的某些区域,生成Mask图像或记录下这些区域的轮廓点坐标。通常,标注直接生成其中一种文件,即只生成json文件或只生成Mask图像。故在此贴出Mask图像与json文件相互转换的Python代码。如果输入文件夹,则会将文件夹下所有json文