NumPy数据分析基础:数组形态转换转置操作一文详解

作为数据分析三巨头Pandas、matplotlib、NumPy之一,必然要给足面子单独拿出来讲解一波。NumPy应用场景十分宽泛,Pandas很多函数转换后也都是NumPy数组类型的数据结构。在机器学习、深度学习以及一些数据处理操作中使用的频率甚至比Pandas都高。而且NumPy功能强大,使用起

NumPy模块——数组的创建与使用

本文主要讲述Python数据处理Numpy模块中的数组这一概念进行解释和说明,主要介绍数组的创建和使用方法,为方便理解,以列表与之作对比加深理解!

NumPy数据分析基础:ndarray数组运算基本操作及切片索引迭代

作为数据分析三巨头Pandas、matplotlib、NumPy之一,必然要给足面子单独拿出来讲解一波。NumPy应用场景十分宽泛,Pandas很多函数转换后也都是NumPy数组类型的数据结构。在机器学习、深度学习以及一些数据处理操作中使用的频率甚至比Pandas都高。而且NumPy功能强大,使用起

单变量时间序列平滑方法介绍

在本文中将介绍和解释时间序列的平滑方法

10种常见的回归算法总结和介绍

线性回归是机器学习中最简单的算法,它可以通过不同的方式进行训练。 在本文中,我们将介绍以下回归算法:线性回归、Robust 回归、Ridge 回归、LASSO 回归、Elastic Net、多项式回归、多层感知机、随机森林回归和支持向量机。

【Python数据科学快速入门系列 | 08】类别比较图表应用总结

数据可视化是数据分析的重要手段,而不同的应用场景应选择不一样的图表。根据应用场景的不同,我们将图表分为6类:类别比较图表、数据关系图表、数据分布图表、时间序列图表、整体局部图表、地理空间图表。类别比较图表强调分类数据的规模对比数据关系图表强调2个或以上变量的相关性关系。例如机器学习、深度学习时分析特

Pandas数据分析:快速图表可视化各类操作详解+实例代码(三)

一般我们做数据挖掘或者是数据分析,再或者是大数据开发提取数据库里面的数据时候,难免只能拿着表格数据左看右看,内心总是希望能够根据自己所想立马生成一张数据可视化的图表来更直观的呈现数据。而当我们想要进行数据可视化的时候,往往需要调用很多的库与函数,还需要数据转换以及大量的代码处理编写。

Pandas数据分析:快速图表可视化各类操作详解+实例代码(二)

一般我们做数据挖掘或者是数据分析,再或者是大数据开发提取数据库里面的数据时候,难免只能拿着表格数据左看右看,内心总是希望能够根据自己所想立马生成一张数据可视化的图表来更直观的呈现数据。而当我们想要进行数据可视化的时候,往往需要调用很多的库与函数,还需要数据转换以及大量的代码处理编写。

2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(二)

这篇文章主要是弥补了上篇文章遗留下来的数据趋势和销售单价的问题,并且将时序预测模型给完全做出来,可以说是任务量满满啊,那么现在我们就开始着手一步一步建模。

一文速学-时间序列分析算法之移动平均模型(MA)详解+Python实例代码

有一段时间没有继续更新时间序列分析算法了,传统的时间序列预测算法已经快接近尾声了。按照我们系列文章的讲述顺序来看,还有四个算法没有提及:平稳时间序列预测算法都是大头,比较难以讲明白。但是这个系列文章如果从头读到尾,细细品味研究的话,会发现时间序列预测算法从始至终都在做一件事,也就是如何更好的利用到历

Part 11:Pandas的索引index所具备的四大性能

把数据存储于普通的column列也能用于数据查询,那使用index有什么好处?当s1+s2中遇到另一方没有找到相同的索引时,会显示NaN,无法进行算术操作时。Categoricallndex,基于分类数据的Index,提升性能;Datetimelndex,时间类型索引,强大的日期和时间的方法支持;%

Pandas的DataFrame & Series【详解】

Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。Series 由索引(index)和列组成,函数如下:pandas.Series( data, index, dtype, name, copy)参数说明:data:一组数据(ndarray 类型)

Python将字符串转换成dataframe

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。喜欢通过博客创作的方式对所学的知识进行总结与归纳,不仅形成深入且独到的理解,而且能够帮助新手快速入门。本文

【数据挖掘】pandas使用手册

pandas使用手册

Pandas数据分析:处理文本数据(str/object)各类操作+代码一文详解(一)

Pandas数据分析系列专栏已经更新了很久了,基本覆盖到使用pandas处理日常业务以及常规的数据分析方方面面的问题。从基础的数据结构逐步入门到处理各类数据以及专业的pandas常用函数讲解都花费了大量时间和心思创作,如果大家有需要从事数据分析或者大数据开发的朋友推荐订阅专栏,将在第一时间学习到Pa

PySpark数据分析基础:pyspark.mllib.regression机器学习回归核心类详解(一)+代码详解

PySpark数据分析基础系列文章更新有一段时间了,其中环境搭建和各个组件部署都已经完成。借此征文活动我将继续更新Pyspark这一大块内容的主体部分,也是十分重要且比较难懂不易编程的部分。在从事大数据计算以及分析的这段历程中,陪伴我最多的也就是anaconda和Jupyter了,当然此次演示还是用

最大似然估计(MLE)入门教程

最大似然估计(Maximum Likelihood Estimation)是一种可以生成拟合数据的任何分布的参数的最可能估计的技术。它是一种解决建模和统计中常见问题的方法——将概率分布拟合到数据集。

时间序列的数据分析(六):指数平滑预测法

本文主要介绍了指数平滑预测法的一些基本方法如简单指数平滑,趋势法、阻尼趋势法,季节性法。需要说明的是本文主要参考了并将书中原来用R语言实现的算法用Python实现了一下,在python代码中调用的指数平滑算法包主要来自于statsmodels包。通过对的学习并结合对statsmodels包的练习可以