7个步骤详解AdaBoost 算法原理和构建流程

AdaBoost 是集成学习中的一个常见的算法,它模仿“群体智慧”的原理:将单独表现不佳的模型组合起来可以形成一个强大的模型。

【深度学习】笔记2-模型在测试集的准确率大于训练集

在模型训练过程中突然发现,模型的准确率在测试集上居然比在训练集上还要高。但是我们知道,我们训练模型的方式就是在训练集上最小化损失。因此,模型在训练集上有着更好的表现,才应该是正常的现象。那么,是什么导致了在测试集上准确率更高的现象呢?......

sklearn实现一元线性回归 【Python机器学习系列(五)】

sklearn实现一元线性回归 【Python机器学习系列(五)】

【机器学习】数据科学基础——机器学习基础实践(一)

【机器学习】数据科学基础——机器学习基础实践,基于百度飞桨开发,参考于《机器学习实践》所作。

10个自动EDA库功能介绍:几行代码进行的数据分析靠不靠谱

在本文中整理了10个可以自动执行EDA并生成有关数据的见解的软件包,看看他们都有什么功能,能在多大程度上帮我们自动化解决EDA的需求。

如何科学预测后代的身高

否者环境的效应为负,那就达不到理论身高了,误差是负的。如果成千上万的亲子身高数据,我们就可以观测到回归的现象,就是高尔顿所观测到的高的父母,后代会低于父母的平均值,低的父母,会高于父母的平均值。对于第二个,这是随机的,但是可以通过基因分型检测出来孟德尔抽样,也就是在孩子小的时候就可以检测出来像父亲还

【机器学习】数据科学基础——神经网络基础实验

【机器学习】数据科学基础——神经网络基础实验,基于百度飞桨开发,参考于《机器学习实践》所作。

【机器学习】21天挑战赛学习笔记(二)

1.什么是聚类学习聚类一直是机器学习、数据挖掘、模式识别等领域的重要组成内容。聚类是在无标记样本的条件下将数据分组,他通常被用于以下三个方面:🌈发现数据的潜在结构🌈对数据进行自然分组🌈对数据进行压缩这几个方面的功能使聚类既可以作为预处理程序,又可以作为独立的分析工具。2.聚类的描述数据聚类(聚

8个常见的机器学习算法的计算复杂度总结

计算的复杂度是一个特定算法在运行时所消耗的计算资源(时间和空间)的度量。

在表格数据集上训练变分自编码器 (VAE)示例

变分自编码器 (VAE) 是在图像数据应用中被提出,但VAE不仅可以应用在图像中。在这篇文章中,我们将简单介绍什么是VAE,以及解释“为什么”变分自编码器是可以应用在数值类型的数据上,最后使用Numerai数据集展示“如何”训练它。

机器学习强基计划1-1:图文详解感知机算法原理+Python实现

感知机是最简单的二分类线性模型,也是神经网络的起源算法。本文图文详解感知机算法原理+手推公式,附Python代码实战加深理解

使用百度EasyDL实现厂区工人抽烟行为识别

在安全巡检场景中,我们通常建议采用端云协同的业务模式,也就是将模型部署至边缘计算节点,在边缘直接完成视频分析,并将分析得到的结构化数据回传至云端,从而避免视频传输所带来的额外延时,以获得较好的业务实时性。通常情况下,我们建议智能视频分析采用端云协同模式,也就是在边缘节点上直接进行视频分析,并将分析后

10快速入门Query函数使用的Pandas的查询示例

pandas.的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了10个示例,掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。

一文带你了解推荐系统常用模型及框架

通过对用户之间的关系,用户对物品的评价反馈一起对信息进行筛选过滤,从而找到目标用户感兴趣的信息。用户—商品的评分矩阵(该矩阵很可能是稀疏的)用户\物品xxxxxx行向量表示每个用户的喜好,列向量表明每个物品的属性余弦相似度皮尔逊相关系数欧氏距离曼哈顿距离主要有基于用户的协同过滤与基于物品的协同过滤。

使用分类权重解决数据不平衡的问题

在分类任务中,不平衡数据集是指数据集中的分类不平均的情况,会有一个或多个类比其他类多的多或者少的多。

使用内存映射加快PyTorch数据集的读取

本文将介绍如何使用内存映射文件加快PyTorch数据集的加载速度

手推机器学习 吴恩达 神经网络BP反向传播矩阵推导(上篇)

吴恩达机器学习 神经网络BP反向传播算法 基础篇

【机器学习算法】集成学习-1 强学习器的融合学习

集成学习认为多个决策者比一个决策者可能会做出更好的决策,各种模型的整合也是如此,机器学习这种多样化就是通过集成学习的技术实现的。

30 个数据工程必备的Python 包

在本文中,将介绍一些非常独特的并且好用的 Python 包,它们可以在许多方面帮助你构建数据的工作流。

18张图,直观理解为什么神经网络这么有效?

迄今,人们对神经网络的一大疑虑是,它是难以解释的黑盒。本文则主要从理论上理解为什么神经网络对模式识别、分类效果这么好,其本质是通过一层层仿射变换和非线性变换把原始输入做扭曲和变形,直至可以非常容易被区分不同的类别。实际上,反向传播算法(BP) 其实就是根据训练数据不断地微调这个扭曲的效果。.....