在gpu上运行Pandas和sklearn

Pandas和sklearn这两个是我们最常用的基本库,Rapids将Pandas和sklearn的功能完整的平移到了GPU之上

机器学习之手写决策树以及sklearn中的决策树及其可视化

(2)如果属性划分次数达到上限,即属性划分完了,或者是样本中在此类属性取值都一样,可以认为全部划分仍然存在不同类的样本,那么这个节点就标记为类别数占较多的叶节点。划分选择还是比较重要的,因为不同的划分选择会建出不同的决策树。划分选择的指标就是希望叶节点的数据尽可能都是属于同一类,即节点的“纯度”越来

使用阈值调优改进分类模型性能

在本文中将演示如何通过阈值调优来提高模型的性能。

猿创征文|Python-sklearn机器学习快速入门:你的第一个机器学习实战项目

从开始学习机器学习到现在已经有三年了,建模过程以及各类模型使用场景都有个大致的掌握。其中我感觉在我所有的机器学习文章中缺少一篇真正引人入门的文章。任何情况迈开学习的第一步都是比较困难的,学习的成本是很高的,相对你学会了收益也高。尤其是机器学习这种数学和逻辑能力强关联的学科,是比较难上手的事,但是当真

sklearn实现一元线性回归 【Python机器学习系列(五)】

sklearn实现一元线性回归 【Python机器学习系列(五)】

浅谈sklearn中的数据预处理

sklearn中的数据预处理

LightGBM原理与实践简记

写在前面:LightGBM 用了很久了,但是一直没有对其进行总结,本文从 LightGBM 的使用、原理及参数调优三个方面进行简要梳理。目录使用 LightGBM 官方接口,核心步骤sklearn 接口增量学习在处理大规模数据时,数据无法一次性载入内存,使用增量训练。主要通过两个参数实现:详细方法见

机器学习作业(第十八次课堂作业)

机器学习作业(第十八次课堂作业)

python机器学习从入门到高级:超参数调整(含详细代码)

Python机器学习🌸个人主页:JoJo的数据分析历险记📝个人介绍:小编大四统计在读,目前保研到统计学top3高校继续攻读统计研究生💌如果文章对你有帮助,欢迎✌关注、👍点赞、✌收藏、👍订阅专栏在我们选择好一个模型后,接下来要做的是如何提高模型的精度。因此需要进行超参数调整,一种方法是手动处

Python机器学习从入门到高级:模型评估和选择(含详细代码)

之前我们介绍了机器学习的一些基础性工作,介绍了如何对数据进行预处理,接下来我们可以根据这些数据以及我们的研究目标建立模型。那么如何选择合适的模型呢?首先需要对这些模型的效果进行评估。本文介绍如何使用`sklearn`代码进行模型评估

机器学习系列6 使用Scikit-learn构建回归模型:简单线性回归、多项式回归与多元线性回归

在本文中,我们以美国南瓜数据为例,讲解了三种线性回归的原理与使用方法,探寻数据之间的相关性,并构建了6种线性回归模型。将准确率从一开始的0.04提升到0.96.

机器学习——CART决策树——泰坦尼克还生还预测

Scikit-learn库中实现的决策树的算法是优化的CART算法。分类决策树的类是DecisionTreeClassifier。

《机器学习实战:基于Scikit-Learn、Keras和TensorFlow第2版》-学习笔记(4):训练模型

第四章 训练模型· Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition, by Aurélien Géron (O’Reilly). Copyright 2019 Aurélien Géron

机器学习——垃圾邮件识别——SVM、MNB模型使用

本次案例采用SVM、MNB模型进行对比用Accuracy、F1 Score进行评估话不多说直接上代码包括数据集下载CSDNhttps://mp.csdn.net/mp_download/manage/download/UpDetailed# 读取数据并用空字符串替换空值df1 = pd.read_c

《机器学习实战:基于Scikit-Learn、Keras和TensorFlow第2版》-学习笔记(2)

《机器学习实战:基于Scikit-Learn、Keras和TensorFlow第2版》 - 第二章 端到端的机器学习项目。Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition, by Aurél

数据预处理之数据的特征缩放——sklearn实现

目录前言一、标准化(StandardScaler)二、归一化(MinMaxScaler)三、正则化(Normalizer)四、绝对值最大标准化(MaxAbsScaler)五、二值化(Binarizer)六、OneHot编码(OneHotEncoder)参考前言在现实任务中,我们的数据集往往存在各种各

如何保存sklearn训练得到的模型?看这一篇就够了

目录前言一、安装joblib参考前言一、安装joblib可以使用pip命令进行安装:pip install joblib对于conda用户,可以考虑使用conda命令:conda install joblib参考[1] 官方文档

数据标准预处理合集_python机器学习sklearn库

文章目录数据获取①归一化 MinMaxScaler1.1默认调用1.2了解相关属性/参数②正则化 Normalizer2.1默认调用2.2相关属性/参数③标准化3.1默认调用3.2相关属性/参数④二值化4.1默认调用4.2相关属性/参数数据获取以鸢尾数据为例,首先加载数据集。from sklearn

深入理解交叉验证与网格搜索——sklearn实现

交叉验证(Cross Validation)和网格搜索(Grid Search)常结合在一起并用来筛选模型的最优参数。本文将从零开始一步步讲解交叉验证和网格搜索的由来,并基于sklearn实现它们。目录一、交叉验证法1.1 交叉验证法的由来1.2 交叉验证法的定义1.3 sklearn.model_

【超详细】基于sklearn实现软硬间隔SVM

目录一、硬间隔SVM1.1 sklearn.svm.SVC()1.1.1 数据集1.1.2 参数1.1.3 方法一、硬间隔SVMsklearn中没有实现硬间隔SVM的类,因为它并不实用,但我们可以通过将正则化项 CCC 设置的足够大(例如 C=106C=10^6C=106)来模拟硬间隔SVM。考虑如

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈