可怕,chatGPT用3小时教会我数据分析

可怕,chatGPT用3小时教会我数据

在Pandas中通过时间频率来汇总数据的三种常用方法

当我们的数据涉及日期和时间时,分析随时间变化变得非常重要。Pandas提供了一种方便的方法,可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。

计算时间序列周期的三种方法

周期是数据中出现重复模式所需的时间长度。更具体地说,它是模式的一个完整周期的持续时间。在这篇文章中,将介绍计算时间序列周期的三种不同方法。

R实战 | Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制

R实战|Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制Nomogram,中文常称为诺莫图或者列线图。简单的说是将Logistic回归或Cox回归的结果进行可视化呈...

Jupyter Lab 的 10 个有用技巧

JupyterLab是 Jupyter Notebook「新」界面。它包含了jupyter notebook的所有功能,并升级增加了很多功能。

【通信原理】揭开傅里叶级数与傅里叶变换的神秘面纱

傅里叶变换和傅里叶级数是有史以来最伟大的数学发现之一。它们可以帮助我们将函数分解成其基本成分。它们揭示了任何数学函数的基本模块,但是傅里叶分析的公式对于连高数中sin2x的积分都不熟悉的工科白菜来说简直就是连多看它一样的勇气都没有,我想这就是为什么复杂的傅里叶分析成为大学中通信专业的疑难杂症的主要原

机器学习实战——疫情数据分析与预测

机器学习如何做到疫情可视化——疫情数据分析与预测实战本文将带领大家爬取11个国家以及中国31个省(自治区、直辖市)在2022.0101-2022.06.19的新冠疫情数据。并且采用机器学习模型对2022.6.20-2022.6.30每一天的全国确诊人数、死亡人数、治愈人数进行预测,**做出疫情可视化

15个节省时间的Jupyter技巧

Jupyter Notebooks使用非常简单并且对于任何面向python的任务都可以非常方便的使用。

Pandas中高效的选择和替换操作总结

在本文中,我们将重点介绍在DataFrame上经常执行的两个最常见的任务,有效地选择特定的和随机的行和列,以及使用replace()函数使用列表和字典替换一个或多个值。

Python中的魔法方法

python中的魔法方法是一些可以让你对类添加“魔法”的特殊方法,它们经常是两个下划线包围来命名的

从另外一个角度解释AUC

AUC到底代表什么呢,我们从另外一个角度解释AUC

时间序列的蒙特卡罗交叉验证

交叉验证应用于时间序列需要注意是要防止泄漏和获得可靠的性能估计本文将介绍蒙特卡洛交叉验证。这是一种流行的TimeSeriesSplits方法的替代方法。

python数据分析绘图

火山图(Volcano plots)是散点图的一种,根据变化幅度(FC,Fold Change)和变化幅度的显著性(P value)进行绘制,其中标准化后的FC值作为横坐标,P值作为纵坐标,可直观的反应高变的数据点,常用于基因组学分析(转录组学、代谢组学等)。从右上角到左下角,随着阈值的逐渐减小,越

使用Python进行交易策略和投资组合分析

我们将在本文中衡量交易策略的表现。并将开发一个简单的动量交易策略,它将使用四种资产类别:债券、股票和房地产。这些资产类别的相关性很低,这使得它们成为了极佳的风险平衡选择。

R语言使用plot函数可视化数据散点图,自定义设置yaxt参数移除Y轴的刻度线

R语言使用plot函数可视化数据散点图,自定义设置yaxt参数移除Y轴的刻度线

【通信原理】揭开傅里叶级数与傅里叶变换的神秘面纱

傅里叶变换和傅里叶级数是有史以来最伟大的数学发现之一。它们可以帮助我们将函数分解成其基本成分。它们揭示了任何数学函数的基本模块,但是傅里叶分析的公式对于连高数中sin2x的积分都不熟悉的工科白菜来说简直就是连多看它一样的勇气都没有,我想这就是为什么复杂的傅里叶分析成为大学中通信专业的疑难杂症的主要原

R实战 | Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制

R实战|Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制Nomogram,中文常称为诺莫图或者列线图。简单的说是将Logistic回归或Cox回归的结果进行可视化呈...

R语言-dnorm-pnorm-qnorm-rnorm的区别

R语言 dnorm, pnorm, qnorm, rnorm的区别前言dnorm, pnorm, qnorm, rnorm 是R语言中常用的正态分布函数. norm 指的是正态分布(也可以叫高斯分布(normal distribution)), R语言中也有其他不同的分布操作也都类似. p q d

使用pandas-profiling对时间序列进行EDA

在这篇文章中,我将利用 pandas-profiling 的时间序列特性,介绍EDA中的一些关键步骤。

使用KNN进行分类和回归

一般情况下k-Nearest Neighbor (KNN)都是用来解决分类的问题,其实KNN是一种可以应用于数据分类和预测的简单算法,本文中我们将它与简单的线性回归进行比较。