支持向量机核技巧:10个常用的核函数总结
支持向量机是一种监督学习技术,主要用于分类,也可用于回归。它的关键概念是算法搜索最佳的可用于基于标记数据(训练数据)对新数据点进行分类的超平面。
多元时间序列特征工程的指南
使用Python根据汇总统计信息添加新特性,本文将告诉你如何计算几个时间序列中的滚动统计信息。将这些信息添加到解释变量中通常会获得更好的预测性能。
R语言使用plot函数可视化数据散点图,自定义设置yaxt参数移除Y轴的刻度线
R语言使用plot函数可视化数据散点图,自定义设置yaxt参数移除Y轴的刻度线
数据挖掘-模型怎么解决业务需求(五)
从项目的需求发起,到数据准备,再到模型训练、评估、上线,这些环节都遇到了什么样的问题,我们解决了什么问题,又有哪些问题尚未解决,在时间等条件充裕的情况下还可以做哪些尝试。介绍了一些关于模型保存、模型优化、模型部署的思路。讲解了关于项目总结,乃至模型监控等内容。
数据挖掘-模型的评估(四)
模型的各种评估指标,从一个混淆矩阵出发,衍生出一系列的准确度评测对模型泛化能力进行评估介绍了如何在数据上进行一些优化从而减少评估时产生误差。
1000个大数据/人工智能毕设选题推荐
正值毕业季我看到很多同学都在为自己的毕业设计发愁Maynor在网上搜集了1000个大数据的毕设选题,希望对大家有帮助~适合大数据毕业设计的项目,完全可以作为本科生当前较新的毕业设计题目选择方向。
11个常见的分类特征的编码技术
机器学习算法只接受数值输入,所以如果我们遇到分类特征的时候都会对分类特征进行编码,本文总结了常见的11个分类变量编码方法。
【通信原理】揭开傅里叶级数与傅里叶变换的神秘面纱
傅里叶变换和傅里叶级数是有史以来最伟大的数学发现之一。它们可以帮助我们将函数分解成其基本成分。它们揭示了任何数学函数的基本模块,但是傅里叶分析的公式对于连高数中sin2x的积分都不熟悉的工科白菜来说简直就是连多看它一样的勇气都没有,我想这就是为什么复杂的傅里叶分析成为大学中通信专业的疑难杂症的主要原
利用python实现Apriori关联规则算法
大家可能听说过用于宣传数据挖掘的一个案例:啤酒和尿布;据说是沃尔玛超市在分析顾客的购买记录时,发现许多客户购买啤酒的同时也会购买婴儿尿布,于是超市调整了啤酒和尿布的货架摆放,让这两个品类摆放在一起;结果这两个品类的销量都有明显的增长;分析原因是很多刚生小孩的男士在购买的啤酒时,会顺手带一些婴幼儿用品
spss分析方法-聚类分析
聚类分析是根据研究对象的特征,按照一定标准对研究对象进行分类的一种分析方法。下面我们主要从下面四个方面来解说: 一、实际应用 聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用
R语言为矩阵的行和列命名:rownames函数指定矩阵行名称、colnames函数指定矩阵列名称
R语言为矩阵的行和列命名:rownames函数指定矩阵行名称、colnames函数指定矩阵列名称
标准化与归一化
Standardization & Nomalisation
时间序列模型-ARIMA
主要介绍了ARIMA模型的基本概念和建模流程。
R实战 | Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制
R实战|Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制Nomogram,中文常称为诺莫图或者列线图。简单的说是将Logistic回归或Cox回归的结果进行可视化呈...
【通信原理】确知信号的性质分析与研究
在前面一文中已经详细且生动的解释了傅里叶变换和傅里叶级数的内容,【通信原理】揭开傅里叶级数与傅里叶变换的神秘面纱,而在今天这篇中有些公式你可能会产生疑惑,基本上需要用到傅氏变化的知识,可能需要你自行了解一下过程或参考一下上一篇文章的内容并加以理解。本文从通信系统中确知信号出发,分析了能量信号、功率信
ROC曲线绘制(Python)
我看谁还不会用Python画出ROC曲线!!!
数据挖掘-KNN算法+sklearn代码实现(六)
KNN最邻近分类算法的实现原理:为了判断未知样本的类别,以所有已知类别的样本作为参照,计算未知样本与所有已知样本的距离,从中选取与未知样本距离最近的K个已知样本,根据少数服从多数的投票法则(majority-voting),将未知样本与K个最邻近样本中所属类别占比较多的归为一类。
数据挖掘-数据的预处理(三)
准备数据:如何处理出完整、干净的数据?原始的数据本身也存在着各种各样的问题:如不够准确、格式多样、部分特征缺失、标准不统一、特殊数据、错误数据等。
10个Pandas的小技巧
pandas是数据科学家必备的数据处理库,我们今天总结了10个在实际应用中肯定会用到的技巧