声音克隆 AI有哪些?

Tacotron:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。WaveNet:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。声音克隆 AI是一类人工智能技术,主要用于生成人类或动物的

Jupyter Notebook自动退出

跟着李沐老师学习深度学习(pytorch),jupyter出现错误

【深度学习】预训练语言模型-BERT

BERT是一种预训练语言模型(pre-trained language model, PLM),其全称是Bidirectional Encoder Representations from Transformers。

利用GPT-3 Fine-tunes训练专属语言模型

ChatGPT强大的自然语言理解力和表达力,目前只表现在通用领域。一旦进入专业领域,ChatGPT经常“一本正经,胡说八道”。此时用特定领域的知识对模型进行微调是时间成本和经济成本最高的解决方案。

文心一言硬刚ChatGPT。文心一言能否为百度止颓?中国版ChatGPT“狂飙”的机会在哪儿?

今天,3月16日消息,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度首席技术官王海峰现在详解了文心一言背后的文心大模型及技术特性。文心一言是新一代知识增强大语言模型,也是百度继文心一格之后的又一个生成式AI产品,具备对话交互、内容创作、知识推理、多模态生成等能力

树莓派+MediaPipe+PCA9685+自制摄像机云台实现人脸跟踪移动

利用几十块钱的机械臂自制了一个摄像头云台,使用了两个MG90S舵机和一块PCA9685驱动的16路舵机扩展板,再通过谷歌的MediaPipe库实现摄像机跟随人脸移动的功能

ChatGPT介绍,与BERT区别及在公司使用方向

ChatGPT介绍,与BERT区别及在公司使用方向

2023年4月的12篇AI论文推荐

GPT-4发布仅仅三周后,就已经随处可见了。本月的论文推荐除了GPT-4以外还包括、语言模型的应用、扩散模型、计算机视觉、视频生成、推荐系统和神经辐射场。

【论文笔记】—低光图像增强—Supervised—URetinex-Net—2022-CVPR

【题目】:URetinex-Net: Retinex-based Deep Unfolding Network for Low-light Image Enhancement 提出了一种基于Retinex的 deep unfolding network (URetinex-Net),它将一个优化问题

全面带你了解AIGC的风口

AIGC (AI Generated Content) 是指通过人工智能技术生成的各种类型的内容,如文字、图片、音频和视频等。AIGC 的作用非常广泛,它能够帮助人们快速地生成大量的内容,为各种应用场景提供支持。AIGC(Artificial Intelligence Generated Conte

YOLOv5源码逐行超详细注释与解读(3)——训练部分train.py

全网最详细的YOLOv5项目源码解读之训练部分train. py。全文近5万字!代码逐行注释,逐段讲解,小白入门必备!

Disco Diffusion 快速入门

Disco Diffusion(DD)是一个CLIP指导的AI图像生成技术,简单来说,Diffusion是一个对图像不断去噪的过程,而CLIP模型负责对图像的文本描。

摄像头标定--camera_calibration

用于指明标定板的内角点数量,如下图每个红圈的位置就是一个内角点,我所使用的GP290标点板有横向有11个内角点,纵向有8个内角点。当所有进度条都变成绿色后,CALIBRATE按钮由灰色变成深绿色,点击CALIBRATE,点击一下后,界面会卡住,此时不要做任何操作,直到运行标定程序的终端输出标定的结果

SVM模型详解

入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。一、SVM定义与解决目标SVM是一个二类分类器。其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化成一个凸二次规划问题的求解。即找到一个超平面,使两类数据离超平

“国货之光”文心一言正式发布:百度大语言模型背后那些不为人知的细节

去年年末,ChatGPT以惊人的速度成为焦点,激起了中国科技界和创投领域的热情,吸引了众多人的关注。互联网巨头纷纷投资支持,科技公司竞相争锋,创业公司亦不甘示弱。甚至与AI毫不相关的企业也借机营销,从而获得股价上涨。几个月后的今天,我们回顾这场风潮,发现大部分人只是炒作和追逐热点,真正投身于实践和创

【OpenCv • c++】 大津法(OTSU)阈值处理

在图像处理中,对于同样的操作,处理灰度图像的计算量要远远小于处理彩色图像,而二值图像(只含灰度值0或1)的计算量比前两者更小。因此,二值化操作在图像处理中有着很大的作用。二值化图像的实现方法有很多。用的最多的方法是利用图像像素点分布规律,设置阈值进行像素点分割,从而得到二值化图像。

TensorRT(C++)部署 Pytorch模型

众所周知,python训练pytorch模型得到.pt模型。但在实际项目应用中,特别是嵌入式端部署时,受限于语言、硬件算力等因素,往往需要优化部署,而tensorRT是最常用的一种方式。本文以yolov5的部署为例,说明模型部署在x86架构上的电脑端的流程。(部署在Arm架构的嵌入式端的流程类似)。

图解transformer | The Illustrated Transformer

写在最前边看transformer相关文章的时候发现很多人用了相同的图。直到我搜到作者的原文……于是决定翻译一下无删改的原文。翻译讲究:信、达、雅。要在保障意思准确的情况下传递作者的意图,并且尽量让文本优美。但是大家对我一个理工科少女的语言要求不要太高,本文只能保证在尽量通顺的情况下还原原文。作者博

【机器学习】——白话入门及术语解释

小白如何快速入门机器学习?如果不做专职的相关岗位开发,自己跑一些学习程序是否可行呢?比较现在各种框架都挺多的了,即使再不济,了解一下具体都能做哪些东西也是很不错的。

强化学习之AC系列算法(AC、A2C、A3C)

强化学习之AC系列算法(AC、A2C、A3C)