机器学习基础自学笔记——决策树(Decision Tree)

决策树基础知识:从信息熵决策熵到信息增益、信息增益率、基尼系数,到两种剪枝处理和随机森林,生动易懂配有自制插图

手把手带你玩转Spark机器学习-使用Spark进行数据降维

本章,我们将继续讲解无监督学习模型中降低数据维度的方法。不同于我们之前分享的回归、分类和聚类,降维方法并不是用来做模型预测的。降维方法从一个D维的数据输入提取出k维表示,k一般远远小于D。因此,降维方法本身是一种预处理方法,或者说是一种特征转换的方法,而不是模型预测的方法。降维方法中尤为重要的是,被

如何比较两个或多个分布:从可视化到统计检验的方法总结

比较一个变量在不同组中的分布是数据科学中的一个常见问题,在这篇文章中,我们将看到比较两个(或更多)分布的不同方法,并评估它们差异的量级和重要性。

评估和选择最佳学习模型的一些指标总结

在评估模型时,虽然准确性是训练阶段模型评估和应用模型调整的重要指标,但它并不是模型评估的最佳指标,我们可以使用几个评估指标来评估我们的模型。

人工智能如何用于静态生物特征验证

静态生物特征验证是一种常用的 AI 功能,它可以实时捕捉人脸,并可以在不提示用户移动头部或面部的情况下确定人脸是否属于真人。通过这种方式,该服务有助于提供获得积极反馈的便捷用户体验。静态生物特征验证需要 RGB 摄像头,并且能够通过细节(例如莫尔图案或纸上的反射)区分真人的面部和欺骗攻击(例如面部和

主动学习(Active Learning) 概述、策略和不确定性度量

主动学习是指对需要标记的数据进行优先排序的过程,这样可以确定哪些数据对训练监督模型产生最大的影响。

DeOldify实现老照片上色(附直接使用的工具代码) | 机器学习

老照片上色其实很早之前就想写了,也有不少人问了我这个项目。最近把DeOldify项目好好弄了弄。

模型的度量指标和损失函数有什么区别?为什么在项目中两者都很重要?

在本文中,我将解释为什么需要两个独立的模型评分函数来进行评估和优化……甚至还可能需要第三个模型评分函数来进行统计测试。

ML之ME:分类预测问题中评价指标(AP/mAP)的简介、使用方法、代码实现、案例应用之详细攻略

ML之ME:分类预测问题中评价指标(AP/mAP)的简介、使用方法、代码实现、案例应用之详细攻略目录评价指标(AP/mAP)的简介1、AP的简介2、AP的理解3、AP与mAP区别及意义评价指标(AP/mAP)的案例应用1、具体比赛场景下的特殊定义(1)、AP (Average Precision)i

即将步入大四,开始我最真情的告白

大一下学期加入机器人实验室,开始接触ROS,从装Ubuntu双系统开始,就开始令我难忘的学习生活,开始学习ROS,学习古月老师的ROS入门21讲,后来有问题,就常常在CSDN上找答案,跟着师哥师姐做实验室的项目,在这个学习的过程中有想过放弃,有过滑水摸鱼,觉得自己是老师和师哥师姐的打工人,是给他们干

Curriculum Labeling:重新审视半监督学习的伪标签

Curriculum Labeling (CL),在每个自训练周期之前重新启动模型参数,优于伪标签 (PL)

如何正确拆分数据集?常见的三种方法总结

拥有适当的验证策略是成功创建良好预测,使用AI模型的业务价值的第一步,本文中就整理出一些常见的数据拆分策略。

联合概率和条件概率的区别和联系

本文解释联合概率和条件概率之间区别和联系

快速上手数据挖掘

数据挖掘是一项应用十分广泛的技术,它能够从历史数据中发掘出有用的规律,然后运用规律去做预测。比如在金融机构中通过挖掘历史用户信息和违约之间的规律进行风险预测,防止坏帐;在营销场景中可以通过挖掘客户消费行为规律寻找潜在客户,进行精准营销;在企业生产中,可以根据历史生产数据来预测良品情况,从而改进工艺降

使用神经网络模型创建一个龙与地下城怪物生成器

龙与地下城(DND)于1974年发行第一版,现在所有RPG游戏都有它的影子,在本文中我们将使用神经网络构建一个能够生成平衡数据的怪物生成器

数据科学的面试的一些基本问题总结

在这篇文章中,将介绍如何为成功的面试做准备的,以及可以帮助我们面试的一些资源。

Machine Learning with Matminer(附代码)

Machine Learning with Matminer(附代码),Matminer是一个开源的、基于python的软件平台,以促进数据驱动的方法来分析和预测材料的属性。

【机器学习】浅谈正规方程法&梯度下降

【机器学习】浅谈正规方程法&梯度下降数据模型为线性回归模型,方程代价函数。代价函数就是实际数据与数学模型(这里是一元一次方程)所预测的差值,如:蓝线的长度就是代价函数,可以看到代价函数越大拟合效果越差,代价函数越小,拟合效果越好。其中关于 θ1\theta_1θ1​ 的的代价函数f(θ1)f(\th

【机器学习】梯度下降之数据标准化

吴恩达机器学习笔记在线性回归中,尤其是多变量回归模型,由于各个的数据之间量化纲位不同,如果数据范围分别是是【0~1000,0 ~5】或者【-0.00004 ~ 0.00002,10 ~ 30】, 那么在使用梯度下降算法时,他们的等高线是一个又窄又高的等高线,如下图:因为一个他们量化纲位不同会出现

KMean算法精讲

  KMeas算法是一种聚类算法,同时也是一种无监督的算法,即在训练模型时并不需要标签,其主要目的是通过循环迭代,将样本数据分成K类。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈