KNN算法数字识别完整代码——打开就可以跑
目录1、原理2、数据集3、代码以及注释1. 数据准备:2. 构建训练数据集:3. 测试集数据测试:4、运行结果5、总结6、致谢1、原理邻近算法,或者说K最近邻(KNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个
基于聚类算法的城市餐饮数据分析与店铺选址
餐饮业生意好坏的影响因素通常有很多,包括店铺菜系、口味、服务态度、周边环境、人口密度、所在区域、人均消费等等方面。本项目以上海城市为例,对其餐饮业消费数据进行统计分析,从三个维度“口味”、“人均消费”、“性价比”对不同菜系进行横向比较。针对某一商铺类型,将上海划分成格网空间,做空间指标评价,基于聚类
轻松学习学 Pandas:17个函数操作可以这样学起来
Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。喜欢记得收藏、点赞、关注。sort_values(dogs[dogs['size'] == 'medium'] .sort_values('type') .groupby('typ
一个简单实例解析移动平均模型 Moving-Average Models
本文将使用简单的说明性示例来解释移动平均模型(Arima [p,q]中的MA [Q])。
秩和比综合评价法(RSR)详解及Python实现和应用
秩和比综合评价法是量化分析数学建模最常用的评价模型之一,在参与数学建模的一些比赛中出现过频数较多的评价系统或是政策影响因素等级排序等相关主题,该模型很够很好的建立评价系统,在多篇国赛美赛优秀论文中都出现过其身影。本篇博客的愿景是希望我或者读者通过阅读这篇博客能够学会RSR方法并能实际运用,而且能够记
R语言使用tidyr包的pivot_longer函数将dataframe数据从宽表变换为长表
R语言使用tidyr包的pivot_longer函数将dataframe数据从宽表变换为长表
R语言使用dplyr包的select函数和filter函数进行行数据筛选(row selection)
R语言使用dplyr包的select函数和filter函数进行行数据筛选(row selection)
Python 大数据的进行信用卡欺诈检测(附源码与注释)
信用卡欺诈检测
机器学习入门-01快速学会使用Matplotlib绘图
快速学会使用Matplotlib绘图使用Matplotlib的基本功能实现图形显示使用Matplotlib实现多图显示使用Matplotlib实现不同画图种类1. Matplotlib之HelloWorld1.1 什么是MatplotlibMatplotlib 是 Python 的绘图库,它能让使用
R语言使用names函数为列表list中的所有数据对象设置名称、使用names函数查看列表中所有数据的名称
R语言使用names函数为列表list中的所有数据对象设置名称、使用names函数查看列表中所有数据的名称
pandas将多个Series对象合并起来形成dataframe、当索引不一致时会产生缺失值NaN
pandas将多个Series对象合并起来形成dataframe、当索引不一致时会产生缺失值NaN
第十届“泰迪杯”数据挖掘挑战赛B题python实现
第十届“泰迪杯”数据挖掘挑战赛B题python实现
常见的8个概率分布公式和可视化
在本文中,我们将介绍一些常见的分布并通过Python 代码进行可视化以直观地显示它们。
检测和处理异常值的极简指南
本文是关于检测和处理数据集中的异常值
机器学习——CART决策树——泰坦尼克还生还预测
Scikit-learn库中实现的决策树的算法是优化的CART算法。分类决策树的类是DecisionTreeClassifier。
python连接MySQL数据库服务器、使用SQL语句查询数据表中满足筛选条件的数据
python连接MySQL数据库服务器、使用SQL语句查询数据表中满足筛选条件的数据
DataFrame多表合并拼接函数concat、merge参数详解+代码操作展示
前言此篇文章接上两篇基础篇章:一文速学-数据分析之Pandas数据结构和基本操作代码DataFrame行列表查询操作详解+代码实战第一章详细介绍了Series和DataFrame作为两种Pandas基本数据结构中的创建、转换和操作。第二章则详细介绍DataFrame行列表查询操作。本打算把DataF
(数据挖掘 —— 无监督学习(聚类)
数据挖掘 —— 无监督学习(聚类)1. K-means1.1 生成指定形状的随机数据1.2 进行聚类1.3 结果2. 系统聚类2.1 代码2.2 结果3 DBSCAN3.1 参数选择3.2 代码3.3 结果1. K-meansK-Means为基于切割的聚类算法1.1 生成指定形状的随机数据impo
数据挖掘 —— 探索性数据分析
数据挖掘 —— 探索性数据分析1. 统计检验1.1 正态性检验1.2 卡方检验1.3 独立分布t检验1.4 方差检验1.5 Q-Q图1.6 相关系数2 单因素分析2.1 线性回归2.2 PCA 奇异值分解2.3 主成分分析(PCA自定义实现)3 复合分析3.1 分组分析3.1.1 离散数据分组3.
数据挖掘 —— 有监督学习(分类)
数据挖掘 —— 有监督学习(分类)1. KNN分类算法2. 决策树分类算法3. SVM算法简介4. 分类——集成算法4.1 随机森林参数介绍4.2 Adaboost算法参数介绍5 总结1. KNN分类算法预备知识:KD-Tree算法 (KDimensional Tree)在空间中寻找与目标点距离最