【纯万字干货】机器学习之数据均衡算法种类大全+Python代码一文详解
对于整个数据建模来看,数据均衡算法属于数据预处理一环。当整个数据集从调出数据库到拿到手的时候,对于分类数据集来说类别一般都是不均衡的,整个数据集合也是较为离散的。因此不可能一拿到数据集就可进行建模,类别的不均衡会极大影响建模判断准确率。其中我们希望整个数据集合的类别数目都是相似的,这样其特征数据权重
opencv 傅里叶变换(python)
图像处理一般分为空间域处理和频率域处理。空间域处理是直接对图像内的像素进行处理。空间域处理主要划分为灰度变换和空间滤波两种形式。频率域处理是先将图像变换到频率域,然后在频率域对图像进行处理,最后再通过反变换将图像从频率域变换到空间域。时间差,在傅里叶变换里就是相位。相位表述的是与时间差相关的信息。在
LightGBM原理与实践简记
写在前面:LightGBM 用了很久了,但是一直没有对其进行总结,本文从 LightGBM 的使用、原理及参数调优三个方面进行简要梳理。目录使用 LightGBM 官方接口,核心步骤sklearn 接口增量学习在处理大规模数据时,数据无法一次性载入内存,使用增量训练。主要通过两个参数实现:详细方法见
Scrapy各种反反爬机制你都知道吗?
目录🍉内容介绍 🌵Scrapy如何设置请求头? 🌵Scrapy获取数据过快被封ip该如何处理? 🌵Scrapy如何动态获取数据你知道吗? 🌵Scrapy程序出现Bug给你发邮件想学习吗?🌴Scrapy请求头设置🌴Scrapy设置时间间隔🌴Scrapy动态获取数据🌴Scrapy发邮件
Python自动化办公:批量识别图片文字并存为Excel
Python OCR 真的太棒了
基于Python构建机器学习Web应用
🏆🏆在本文中,我们基于之前的亚洲美食数据集构建了SVC模型,并介绍了模型可视化工具Netron与Onnx模型格式的使用。与之前基于Python的pkl格式模型相比,Onnx格式的模型适用性更好,可以在多个平台使用。且OnnxRuntime拥有各种语言的API,💻我们可以在各个环境中部署机器学习
有空就学学的实例分割1——Tensorflow2搭建Mask R-CNN实例分割平台
Mask R-CNN是He Kaiming大神2017年的力作,其在进行目标检测的同时进行实例分割,取得了出色的效果。其网络的设计也比较简单,在Faster R-CNN基础上,在原本的两个分支上(分类+坐标回归)增加了一个分支进行语义分割,https://github.com/bubbliiiing
初学Yolov1学习心得分享
第一次写博客记录自己的学习分享,开始复现一些经典的YOLO系列论文,首先分享经典的 Yolov1算法。
独热(One-Hot)编码简述
独热编码即 One-Hot 编码,又称一位有效编码。其方法是使用 N 位状态寄存器来对 N 个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。One-Hot编码是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的
机器学习中的数据预处理方法与步骤
机器学习预处理详细方法
简单遗传算法优化简单一元函数(python)
本文待优化函数选取自《MATLAB智能算法30个案例分析(第2版)》中的第一个案例利用遗传算法计算以下函数的最小值:f(x)=sin(10πx)x,x∈[1,2]f(x) = \frac{\sin(10 \pi x)}{x},x\in[1,2]f(x)=xsin(10πx),x∈[1,2]关于遗
第一篇博客 未来可期
包含本新手码农的学习内容、学习时间以及对未来的就业规划
Python 人脸识别系统
简介人脸识别不同于人脸检测。在人脸检测中,我们只检测了人脸的位置,在人脸识别任务中,我们识别了人的身份。本文重点介绍使用库 face_recognition 实现人脸识别,该库基于深度学习技术,并承诺使用单个训练图像的准确率超过 96%。识别系统用例寻找失踪者识别社交媒体上的帐户识别汽车中的驾驶员考
Python最全学习路线
Python学习路线
一文读懂机器学习分类全流程
🏆在本文中,作者将带你了解机器学习分类的全流程,从问题分析>数据预处理>分类器选择>模型构建>精度评价>模型发布为Web应用。从0带读者入门机器学习分类。
零基础入门YOLOv5——从制作数据集到最终训练与测试
零基础入门YOLOv5——从制作数据集到最终训练与测试 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录零基础入门YOLOv5——从制作数据集到最终训练
学习 Python 之 Pandas库
学习 Python 之 Pandas库Pandas库什么是Pandas库?DataFrame 创建和存储1. 使用DataFrame构造函数(1). 使用列表创建(2). 使用字典创建(3). 从另一个DataFrame对象创建2. 从文件读取(1). 从.csv文件读取(2). 从excel文件读
Python模糊基础点--集合中的交集、并集与差集特性、数据序列中的公共方法、列表集合字典推导式
目录集合中的交集、并集与差集特性数据序列中的公共方法第一部分第二部分序列类型之间的相互转换list():把某个序列类型的数据转化为列表tuple():把某个序列类型的数据转化为元组set():将某个序列转换成集合(集合可以快速完成列表去重并且不支持下标)列表集合字典推导式列表推导式字典推导式集合推导
一文搞懂如何使用饱和预测
本文采用Prophet模型对时间序列进行饱和预测,饱和预测通俗一点理解就是在对一系列参数进行预测时会达到一个顶点,我们需要研究的就是预测这个饱和点。
(详细步骤和代码)利用A100 GPU加速Tensorflow
利用A100 GPU加速TensorflowNVIDIA A100 基于 NVIDIA Ampere GPU 架构,提供一系列令人兴奋的新功能:第三代张量核心、多实例 GPU (MIG) 和第三代 NVLink。Ampere Tensor Cores 引入了一种专门用于 AI 训练的新型数学模式:T