大咖齐聚CCIG论坛——文档图像智能分析的产业前沿

2023年5月13日,中国图象图形学学会文档图像分析与识别专业委员会与上海合合信息科技有限公司联合打造《文档图像智能分析与处理》高峰论坛。欢迎感兴趣的同学们参加

图片、视频修复并超分 - Real-ESRGAN项目使用(一) | 机器学习

前段时间一直在弄golang,很少关注一些开源项目。正巧碰到一个,可以将模糊的照片或者视频修复清晰,且可以超分处理的项目。

机器学习强基计划8-5:图解局部线性嵌入LLE算法(附Python实现)

局部线性嵌入(Locally Linear Embedding, LLE)限制样本在降维后的低维空间中的k近邻局部线性关系,等价于原始空间。本文详解LLE算法原理并给出Python实现

AI算力碎片化:矩阵乘法的启示

尽管AI的发展取得了巨大进步,但编译器LLVM之父Chris Lattner认为,AI技术应用并不深入,远远没有发挥出已有机器学习研究的所有潜力。而AI系统和工具的单一化和碎片化正是造成这一问题的根源。为了让AI发挥其真正的潜力,计算碎片化是需要解决的重点问题之一,目标是让AI软件开发人员能够无缝地

forward函数——浅学深度学习框架中的forward

forward函数是深度学习框架中常见的一个函数,用于定义神经网络的前向传播过程。在训练过程中,输入数据会被传入神经网络的forward函数,然后经过一系列的计算和变换,最终得到输出结果。具体来说,forward函数的作用是将输入数据经过网络中各个层的计算和变换后,得到输出结果。在forward函数

基于VITS 快速微调的本地环境配置、本地训练以及本地推理的教程

该教程能教会读者如何使用本地服务器使用VITS微调训练自己的想要的角色的声音并且本地推理,注意只能使用linux版本进行训练,但是推理可以在windows上完成。

分割常用损失函数

交叉熵损失公式:其中表示真实标签,表表示预测结果。优点:交叉熵Loss可以用在大多数语义分割场景中。缺点:对于只分割前景和背景的时候,当前景像素的数量远远小于背景像素的数量时,即y=0的数量远远大于y=1的数量,损失函数中y=0的成分就会占据主导,使得模型严重偏向背景,导致效果不好。(该缺点对二分类

transformers包介绍——nlp界最顶级的包——可以不用 但不能不知道——python包推荐系列

transformers包介绍——nlp界最顶级的包——可以不用 但不能不知道——python包推荐系列

Chat-GPT 的优点、缺点和潜力,GPT 技术伦理概述,以及其功能的示例教程

在过去的两个月里,互联网一直沉迷于Chat-GPT(生成式预训练转换器),这是一种被认为是神奇的语言模型,可以写出类似人类的文章(包括防抄袭),能够编写代码以无论用户想要什么,让整个职业生涯都过时,似乎世界上几乎有任何答案!显然,当发布了显然具有无限解决方案的东西时,人们必然会利用它,滥用他们的工具

阿里云免费使用stable diffusion三个月【ai生成图片】详细教程【保姆级】

如图所示 Stable Diffusion WebUI 的操作界面主要分为:模型区域、功能区域、参数区域、出图区域。txt2img 为文生图功能,重点参数介绍:正向提示词:描述图片中希望出现的内容反向提示词:描述图片中不希望出现的内容Sampling method:采样方法,推荐选择 Euler a

微软AI 绘图工具+ChatGPT免费用,10秒轻松出图,超详细教程,纯干货分享

微软Bing开放了一款免费AI绘图工具,名为“Bing Image Creator”,中文名叫“影像建立者”(名字起得怪怪的,不好听),基于OpenAI的DALL-E 图片生成技术。微软Bing Image Creator(影像建立者)虽然免费使用,但它初始会为每位用户提供25个点数,每生成一次图片

信号处理-小波包分解

连续小波变换:小波函数与原信号对应点相乘,再相加,得到对应点的小波变换系数,平移小波基函数,再计算小波函数与原信号对应点相乘,再相加,这样就得到一系列的小波系数。工程应用中经常需要对一些非平稳信号进行,小波分析和小波包分析适合对非平稳信号分析,相比较小波分析,利用小波包分析可以对信号分析更加精细,小

GPT4All 一个开源 ChatGPT

开源项目和社区努力在实施技术和加速创意方面非常强大。GPT4All 就是一个显着的体现。从根本上说,这为闭源模型的业务方面提供了一个有趣的视角。如果提供 AI 作为服务,那么需要多长时间才能让爱好者对 AI 进行足够长的探索以能够模仿它?对于 GPT4All 的案例,论文中有一个有趣的注释:花了四天

NLP领域大语言模型汇总

大语言模型是近年来人工智能领域重要研究方向之一。它们是基于深度学习技术构建的神经网络,可以自动学习和生成自然语言文本,如文章、对话、诗歌、代码等等。本文主要真针对目前比较火热的自然语言大语言模型,进行简单介绍,LLM包括了OpenAI的ChatGPT、百度文心一言、清华的GLM等模型。

【自然语言处理】主题建模:BERTopic(理论篇)

在我的博客中已经写了很多关于主题建模的内容,当你准备了解 BERTopic 时,默认你已经知道了 LSA、pLSA、NFM、LDA 等传统的主题建模方法。关于主题建模的前置知识我在这里不做赘述,感兴趣的同学可以看看我前几篇博客。学习 BERTopic 需要一定的机器学习基础,让我们一起开始吧!

98家央企及下属上市企业全名单(2023版)

1月10日,央企专业化整合又有新动作。经过整合,我国生物质发电领域龙头企业国能生物重组进入国家电投,中国电建旗下的医疗机构将加入通用技术集团。中储粮集团、中粮集团开展储备加工领域分类改革股权合作,组建中储粮集团控股的粮食仓储业务合资公司和中粮集团控股的油脂油料加工合资公司。近两年,央企重组整合驶入快

百度飞桨 paddleX操作手册

paddleX操作手册

传统语音增强——基本的维纳滤波语音降噪算法

传统语音增强——基本的维纳滤波语音降噪算法

手把手教你声音克隆(so-vits-svc)

视频里所使用的技术是 so-vits-svc,是音频转音频,属于音色转换算法,支持正常的说话,也支持歌声的音色转换。下面具体介绍如何使用so-vits-svc。

【YOLOv8】实战一:手把手教你使用YOLOv8实现实时目标检测

YOLOv8导出为onnx模型,YOLOv8在LabVIEW中的部署,实现实时目标检测!在CPU和GPU上实现加速