【数据挖掘竞赛】零基础入门数据挖掘-二手汽车价格预测

数据预处理时首先可以对偏度比较大的数据用log1p函数进行转化,使其更加服从高斯分布,此步处理可能会使我们后续的分类结果得到一个好的结果.notRepairedDamage 中存在空缺值,但空缺值用“-”表示,所以数据查看发现不了空缺值,将“-”替换成NaN。图中可以看出,seller,offerT

使用Statsmodel进行假设检验和线性回归

在本文中,我们将介绍 statsmodel 库的基础知识、如何使用它以及它的好处。

【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题二

在此任务中,首先,读取训练集和预测集数据,并将训练集中的日期列转换为日期类型,并将其设置为数据集的索引。接着,将数据按照一定的维度进行分组,并将每个组的时间序列进行了平稳性检验,若不平稳则进行一阶或者多阶差分,直到序列平稳。基于问题一的分析,建立数学模型,对附件预测数据(predict_sku1.c

将时间序列转换为分类问题

【商业挖掘】关联规则——Apriori算法(最全~)

【商业挖掘】关联规则——Apriori算法(最全~) 大三商科小辣鸡编写的大白话算法!

【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一

然后,可以计算出每个节假日的平均需求量,将其与普通日的需求量进行比较,从而分析节假日对产品需求量的影响。例如,如果线上订单需求量的中位数明显高于线下订单需求量的中位数,那么我们可以判断线上销售渠道对产品需求量的贡献较大。从结果中可以看出,不同季节的订单需求量分布存在差异,例如冬季的订单需求量普遍较高

第十一届“泰迪杯”数据挖掘挑战赛(B题:产品订单的数据分析与需求预测)

2. 基于上述分析,建立数学模型,对附件预测数据(predict_sku1.csv)中给出的产品,预测未来3月(即2019年1月、2月、3月)的月需求量,将预测结果按照表3的格式保存为文件result1.xlsx,与论文一起提交。(2) 产品所在区域对需求量的影响,以及不同区域的产品需求量有何特性;

零基础入门数据挖掘——二手车交易价格预测:baseline

本文是对阿里云天池竞赛——零基础入门数据挖掘之二手车交易价格预测的学习记录,是一个很简单的baseline。

【数据挖掘】期末复习题库集

【数据挖掘】期末复习题库集

第十一届泰迪杯B题:产品订单的数据分析与需求预测

2. 基于上述分析,建立数学模型,对附件预测数据(predict_sku1.csv)中给出的产品,预测未来3月(即2019年1月、2月、3月)的月需求量,将预测结果按照表3的格式保存为文件result1.xlsx,与论文一起提交。附件中的预测数据(predict_sku1.csv)提供了需要预测产品

【第十一届“泰迪杯”数据挖掘挑战赛】B题产品订单的数据分析与需求预测“解题思路“”以及“代码分享”

此题我们需要分析:不同大品类2015到2018年需求量分析、不同细分品类2015到2018年需求量分析从而得出不同点与共同点。首先需要对日期进行判断月初、月中、月末区间,打上标签,再根据标签进行分组(注意:数据中2018的12月没有月末区间数据)先对每天的需求量进行统计,再进行对数据季节打标签处理,

Stata 回归结果详解

详细解释stata回归结果的各项指标

2023MathorcupC题电商物流网络包裹应急调运与结构优化问题建模详解+模型代码(一)

第三次继续写数模文章和思路代码了,不知道上次美赛和国赛大家有没有认识我,没关系今年只要有数模比赛艾特我私信我,要是我有时间我一定免费出文章代码好吧!博主参与过十余次数学建模大赛,三次美赛获得过二次M奖一次H奖,国赛二等奖。!!**大家可以参考。

核心圈好图书推荐(二)

我们还是老样子,文章末尾进行优质评论,评论内容要求跟本期图书的内容相关哦!评论受赞数量最多的四位伙伴,可以任选上面两种一本作为福利免费送给你(包邮到家)凉哥也将购买链接放在评论区了,有需求的小伙伴们可以自行购买!!!

【Paraview教程】第一章安装与基础介绍

ParaView基本的交互式可视化功能,主要包括数据加载,数据处理,参数调整和数据交互等功能。如切割,剪裁,轮廓,探测都能通过paraview实现。

2023年泰迪杯数据挖掘挑战赛B题--产品订单数据分析与需求预测(1.数据处理)

本题相对来说比较适合新手,包括针对数据的预处理,数据分析,特征提取以及模型训练等多个步骤,完整的做下来是可以学到很多东西的。

一文速学-XGBoost模型算法原理以及实现+Python项目实战

集成模型Boosting补完计划第三期了,之前我们已经详细描述了AdaBoost算法模型和GBDT原理以及实践。通过这两类算法就可以明白Boosting算法的核心思想以及基本的运行计算框架,余下几种Boosting算法都是在前者的算法之上改良得到,尤其是以GBDT算法为基础改进衍生出的三种Boost

第十一届泰迪杯数据挖掘挑战赛-产品订单数据分析B题(完整代码)--数据处理--第一部分(下一部分请看下一博客)

第十一届泰迪杯数据挖掘挑战赛-B题,数据处理以及特征序列增加

用CTGAN生成真实世界的表格数据

随着CLIP和稳定模型的快速发展,图像生成领域中GAN已经不常见了,但是在表格数据中GAN还是可以看到它的身影。

时间序列—显著相关性和滞后性分析_python

本文讲述了两个时间序列(信号)的相关性分析,可以利用相关性分析进行特征筛选。此外本文还讲了怎么判断时间序列的滞后性的方法。