使用手工特征提升模型性能

本文将使用信用违约数据集介绍手工特征的概念和创建过程。

关于LightGBM算法基本原理概述

2017年微软公司提出了LightGBM算法(Light Gradient Boosting Machine),该算法也是基于GBDT算法的改进,,但相较于GBDT、XGBoost算法,LightGBM算法有效地解决了处理海量数据的问题,在实际应用中取得出色的效果。

非参数检验方法,核密度估计简介

核密度估计(Kernel Density Estimation,简称KDE)是一种非参数统计方法,用于估计数据样本背后的概率密度函数

聚类算法(下):10个聚类算法的评价指标

上篇文章我们已经介绍了一些常见的聚类算法,下面我们将要介绍评估聚类算法的指标

聚类算法(上):8个常见的无监督聚类方法介绍和比较

本文将全面概述Scikit-Learn库中用于的聚类技术以及各种评估方法。本文作为第一部分将介绍和比较各种聚类算法

稀疏特征和密集特征

在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。

选择最佳机器学习模型的10步指南

机器学习可以用来解决广泛的问题。但是有很多多不同的模型可以选择,要知道哪一个适合是一个非常麻烦的事情。本文的总结将帮助你选择最适合需求的机器学习模型。

在Pandas中通过时间频率来汇总数据的三种常用方法

当我们的数据涉及日期和时间时,分析随时间变化变得非常重要。Pandas提供了一种方便的方法,可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。

02-18 周六 图解机器学习之SMV 第五章5-2

本文主要详细描述了机器学习中分类,尤其是svm,在分类标签classes_,predict等的属性的访问。并且描述了ovo和ovr两种分类器时的训练方式。本文也消息描述了controur、meshgrid的使用技巧。

广义学习矢量量化(GLVQ)分类算法介绍和代码实现

广义学习矢量量化(Generalized Learning Vector Quantization,GLVQ)是一种基于原型的分类算法,用于将输入数据分配到先前定义的类别中。

计算时间序列周期的三种方法

周期是数据中出现重复模式所需的时间长度。更具体地说,它是模式的一个完整周期的持续时间。在这篇文章中,将介绍计算时间序列周期的三种不同方法。

概率和似然

在日常生活中,我们经常使用这些术语。但是在统计学和机器学习上下文中使用时,有一个本质的区别。本文将用理论和例子来解释概率和似然之间的关键区别。

yolov5目标检测神经网络——损失函数计算原理

yolov5神经网络的损失函数计算原理

知识图谱嵌入模型 (KGE) 的总结和比较

知识图谱嵌入(KGE)是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型。本文将常见的KGE 模型在捕获关系类型方面的比较

Python时间序列分析--ARIMA模型实战案例

Python时间序列分析--ARIMA模型实战案例

10个用于可解释AI的Python库

XAI的目标是为模型的行为和决定提供有意义的解释,本文整理了目前能够看到的10个用于可解释AI的Python库

概率还不会的快看过来《统计学习方法》——第四章、朴素贝叶斯法

作者简介:整个建筑最重要的是地基,地基不稳,地动山摇。而学技术更要扎稳基础,关注我,带你稳扎每一板块邻域的基础。博客主页:啊四战斗霸的博客专栏:《统计学习方法》第二版——个人笔记创作不易,走过路过别忘了三连击了哟!!!关注作者,不仅幸运爆棚,未来更可期!!!***有代码,就有注释!!!Triple

机器学习评估指标的十个常见面试问题

评估指标是用于评估机器学习模型性能的定量指标。本文整理了10个常见的问题。

AI遮天传 ML-决策树(二)

决策树学习第二章

Numpy中数组和矩阵操作的数学函数

Numpy 是一个强大的 Python 计算库。它提供了广泛的数学函数,可以对数组和矩阵执行各种操作。本文中将整理一些基本和常用的数学操作。