R语言使用ggplot2可视化:使用散点图可视化dataframe数据

R语言使用ggplot2可视化:使用散点图可视化dataframe数据

R语言使用tidyr包的pivot_wider函数从长表变换为宽表、pivot_longer函数从宽表变换为长表

R语言使用tidyr包的pivot_wider函数从长表变换为宽表、pivot_longer函数从宽表变换为长表

R语言使用if()函数和else() 函数实战

R语言使用if()函数和else() 函数实战

数据预处理之数据的特征缩放——sklearn实现

目录前言一、标准化(StandardScaler)二、归一化(MinMaxScaler)三、正则化(Normalizer)四、绝对值最大标准化(MaxAbsScaler)五、二值化(Binarizer)六、OneHot编码(OneHotEncoder)参考前言在现实任务中,我们的数据集往往存在各种各

Python日记(5)——matplotlib基础入门(3)

Python日记(4)——matplotlib基础入门(2)在这里插入代码片每天做一个Python小练习,顺便记录一些小技巧。刻度,标签和图例matplotlib中的pyplot方法,专门设计为做交互式作用,包含了xlim、 xticks和xticklabel等方法,这些方法分别控制了绘图范围、刻度

R语言dplyr包使用dplyr函数使用group_by函数、summarise函数和mutate函数计算分组占比实战

R语言dplyr包使用dplyr函数使用group_by函数、summarise函数和mutate函数计算分组占比实战目录R语言dplyr包使用dplyr函数使用group_by函数、summarise函数和mutate函数计算分组占比实战#仿真数据#dplyr函数使用group_by函数、summ

条件随机场(CRF)的详细解释

条件随机场(CRF)结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,其中相邻的上下文信息或状态会影响当前预测,常用于标注或分析序列资料,如自然语言文字或是生物序列

手把手教你用numpy搭建一个单隐层神经网络

在阅读本文之前,请确保你已经有了一定的神经网络基础。目录一、理论部分1.1 正向计算1.2 反向传播一、理论部分1.1 正向计算符号说明\textcolor{red}{符号说明}符号说明设我们的单隐层BP神经网络有 mmm 个输入神经元,nnn 个输出神经元,hhh 个隐层神经元。权重: 第 iii

基于机器学习的恶意样本静态检测的代码详解(ember)

文章目录1. 类与类之间的关系2. 每个类的详细分析2.1 ByteHistogram2.2 ByteEntropyHistogram2.3 SectionInfo2.4 ImportsInfo2.5 ExportsInfo2.6 GeneralFileInfo2.7 HeaderFileInfo2

R语言使用sort函数降序排序向量数据、设置decreasing参数进行降序排序

R语言使用sort函数降序排序向量数据、设置decreasing参数进行降序排序

计算机视觉系列教程2-6:八大图像特效算法制作你的专属滤镜(附Python代码)

美图软件中的那些滤镜效果是如何实现的?本文从原理到Python实战详解八大图像特效算法,为你的图片加一层属于自己的滤镜吧!

LazyProphet:使用 LightGBM 进行时间序列预测

但是当在单变量情况下使用增强树时,由于没有大量的外生特征可以利用,它的性能非常的糟糕。LazyProphet通过新的特征生成方法可以大大提高树型模型处理时序数据的性能

什么是One-Hot Encoding?

独热编码,也称一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且只有一位有效。可以理解为,对于每一个特征,如果它有m个可能值,那么经过独热编码后,就变成了m个二元特征,并且这些特征互斥,每次只有一个特征激活。因此,数据经过独热编码后的结果会变得稀疏。

Python日记(3)——matplotlib基础入门(1)

Python日记(2)——matplotlib基础入门(1)每天做一个Python小练习,顺便记录一些小技巧。由于化工实验数据处理需要把数据转换成图标,所以要逐步学习Python里比较好用的matplotlib库,加下来就是从0基础开始学习的过程。(1)简明matplotlib在使用matplotl

R语言使用levels参数重新排序因子水平级别

R语言使用levels参数重新排序因子水平级别

灰色预测法 —— python

1.简介2.算法详解2.1 生成累加数据2.2累加后的数据表达式2.3求解2.2的未知参数3.实例分析3.1 导入数据3.2 进行累加数据3.3 求解系数3.4 预测数据及对比完整代码

优化算法之手推遗传算法(Genetic Algorithm)的详细步骤图解

遗传算法(Genetic Algorithm, GA)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。

技术升级 | 戴着口罩也能识别人脸啦

近期,国内疫情出现反复,作为抗击疫情的战争中强有力的护盾,口罩再次成为了公民的标配,但在抗疫常态化的进程中,口罩却对诸如“刷脸”支付、身份认证等需要人脸识别的场景提出了挑战。人脸识别原理人脸识别技术在了解人脸识别面临的问题之前,我们首先要了解人脸识别系统,人脸识别系统主要是由硬件和软件两部分构成,硬

下班前几分钟,我彻底弄懂了P-R曲线、ROC与AUC

目录一、均方误差、精度与错误率二、查准率、查全率与F1F1F12.1 查准率(Precision)与查全率(Recall)2.2 混淆矩阵的可视化2.3 P-R曲线与BEP2.4 F1F1F1 与 FβF_{\beta}Fβ​三、ROC与AUC3.1 ROC(Receiver Operating C

贝叶斯网络的D-separation详解和Python代码实现

D分离(D-Separation)又被称作有向分离,是一种用来判断变量是否条件独立的图形化方法。相比于非图形化方法,D-Separation更加直观且计算简单。