吴恩达机器学习丨思维导图丨坚持打卡23天——构建知识脉络,回顾总结复盘

机器学习是目前信息技术中最激动人心的方向之一。本文以吴恩达老师的机器学习课程为主线,使用 Process On 在线绘图构建机器学习的思维导图。16张思维导图,理清机器学习知识脉络,便于学习复盘。

点到直线的距离求法

直线方程是AX+BY+C=0,直线外面一点到直线的距离,传统证明方法如下图:结束!

如何确定多少个簇?聚类算法中选择正确簇数量的三种方法

在本文中,首先介绍两个流行的指标来评估簇质量。然后介绍三种方法来找到最佳簇数量

【超详细】基于sklearn实现软硬间隔SVM

目录一、硬间隔SVM1.1 sklearn.svm.SVC()1.1.1 数据集1.1.2 参数1.1.3 方法一、硬间隔SVMsklearn中没有实现硬间隔SVM的类,因为它并不实用,但我们可以通过将正则化项 CCC 设置的足够大(例如 C=106C=10^6C=106)来模拟硬间隔SVM。考虑如

梯度下降【无约束最优化问题】

本文属于 线性回归算法【AIoT阶段三】(尚未更新),这里截取自其中一段内容,方便读者理解和根据需求快速阅读。本文通过公式推导+代码两个方面同时进行,因为涉及到代码的编译运行,如果你没有 NumPyNumPy,PandasPandas,MatplotlibMatplotlib 的基础,建议先修文章:

使用特征传播重构缺失数据进行图机器学习

本文种展示的特征传播是一种用于处理图机器学习应用程序中缺失的特征的有效且可扩展的方法。它很简单,但效果出奇地好。

时间序列数据的预处理

在本文中,我们将看到在深入研究数据建模部分之前应执行的常见时间序列预处理步骤和与时间序列数据相关的常见问题。

NumPy快速入门(四)——随机抽样与通用函数

目录一、随机抽样(np.random模块)1.1 np.random.random()1.2 np.random.uniform()1.3 np.random.randn()1.4 np.random.randint()1.5 np.random.rand()1.6 np.random.normal

机器学习分类算法之Logistic 回归(逻辑回归)

目录什么是逻辑回归?Sigmoid 函数似然函数梯度下降判定边界损失函数逻辑回归优点逻辑回归缺点代码实现Logistic Regression参数详解正则化选择参数:penalty优化算法选择参数:solver其他参数代码案例结果显示每文一语什么是逻辑回归?逻辑回归算法是用来解决分类问题的。回归与分

8个可以提高数据科学工作效率、节省宝贵时间的Python库

在进行数据科学时,可能会浪费大量时间编码并等待计算机运行某些东西。所以我选择了一些 Python 库,可以帮助你节省宝贵的时间。

线性回归的基本概念以及正规方程

本文属于线性回归算法【AIoT阶段三】(尚未更新),这里截取自其中一段内容,线性回归是机器学习中有监督机器学习下的一种算法。 回归问题主要关注的是因变量(需要预测的值,可以是一个也可以是多个)和一个或多个数值型的自变量(预测变量)之间的关系。需要预测的值:即目标变量,target,y,连续值预测变量

各种距离概念与计算公式

对各种常用的距离的概念和计算公式的汇总整理

为什么交叉熵和KL散度在作为损失函数时是近似相等的

在本文中,我们将介绍熵、交叉熵和 Kullback-Leibler Divergence [2] 的概念,并了解如何将它们近似为相等。

机器学习分类算法之支持向量机

目录支持向量机算法背景介绍什么是线性可分?什么又是超平面?支持向量机的三种情况近线性可分线性不可分不用核函数的传统方法核函数Kernel是什么?核函数SVM求解过程核函数的本质代码实例模型调参gamma调参C值调参使用Polynomial kernel进行预测使用RBF kernel进行预测总结每文

3-导数(梯度/GradientTape)

本节主要介绍梯度或者导数如何计算

牛津大学出品:随机噪声对抗训练

Eη[∥δN−FGSM∥22]=Eη∥η+α⋅sign(∇xℓ(f(x+η),y))∥22=E[∑i=1d(ηi+α⋅sign(∇(η)i))2]=∑i=1dEη[(ηi+α⋅sign(∇(η)i))2]=∑i=1dEη[(ηi+α⋅sign(∇(η)i))2∣sign(∇(η)i)=1]⋅Pη[s

Jensen不等式

引言 概率不等式是概率论和数理统计的理论研究中的重要工具,对于概率极限理论和统计大样本理论,几乎所有重要结果的论证是借助于概率不等式的巧妙应用,Jensen\mathrm{Jensen}Jensen不等式和证明,并应用其带来解决一些相关问题。Jensen\mathrm{Jensen}Jensen不等

Github上10个数据科学和机器学习知识库

在本文中将介绍一些对数据科学和机器学习爱好者最有用的 Github 代码库。(排名顺序不分先后)

【万字详解·附代码】机器学习分类算法之K近邻(KNN)

目录什么是K近邻算法?关于空间的一些基本概念几何空间的五条公理向量关于距离的一些基本概念欧氏距离(Euclidean distance)曼哈顿距离(Manhattan Distance)切比雪夫距离 (Chebyshev Distance)闵可夫斯基距离(Minkowski Distance)杰卡德

2022 年 2 月 arXiv 论文推荐

本篇文章选择了 10 篇论文,这些论文展示了各种 AI 子领域的关键发展:自动强化学习 (AutoRL)、多模态语言模型 (LM)、计算机视觉 (CV) 中的ConvNets vs Transformers 、无监督神经信息 检索 (IR) 等。