统计学 - overfit.cn

为你的数据选择合适的分布：8个实用的概率分布应用场景和选择指南

本文包含了实际会用到的概率分布速查手册，包含使用场景、代码实现和常见陷阱

Deephub 2025-09-18 20:56:45 0 收藏

【AI知识点】置信区间（Confidence Interval）

置信区间（Confidence Interval, CI）是统计学中用于估计总体参数的范围。它给出了一个区间，并且这个区间包含总体参数的概率等于某个指定的置信水平（通常是 90%、95% 或 99%）。与点估计不同，置信区间通过区间估计给出了参数的可能范围，从而提供了更可靠的信息。

overfit同步小助手 2024-12-08 22:01:46 0 收藏

【AI知识点】二项分布（Binomial Distribution）

二项分布（Binomial Distribution）是概率论和统计学中描述独立重复的伯努利试验中成功次数的离散概率分布。它是基于多次独立的伯努利试验的扩展，用于描述在 n 次试验中发生成功的次数。

overfit同步小助手 2024-11-20 10:01:08 0 收藏

随机性、熵与随机数生成器:解析伪随机数生成器（PRNG）和真随机数生成器（TRNG）

本文将探讨随机性、熵的概念以及不同类型随机数生成器(random number generator, RNG)的原理,重点介绍伪随机数生成器(PRNG)和真随机数生成器(TRNG)。

Deephub 2024-11-01 09:36:51 0 收藏

信息论、机器学习的核心概念：熵、KL散度、JS散度和Renyi散度的深度解析及应用

本文深入探讨了信息论、机器学习和统计学中的几个核心概念：熵、KL散度、Jensen-Shannon散度和Renyi散度。这些概念不仅是理论研究的基石，也是现代数据分析和机器学习应用的重要工具。

Deephub 2024-10-15 09:38:51 0 收藏

深入理解双变量（二元）正态投影：理论基础、直观解释与应用实例

二元投影有助于确定在给定另一个变量的特定值时的一个随机变量的期望值。例如,在线性回归中,投影有助于估计因变量如何随自变量变化而变化。

Deephub 2024-08-20 11:39:21 0 收藏

数据并非都是正态分布：三种常见的统计分布及其应用

本文我们研究三种常见分布以及我们如何使用它们：正态分布、泊松分布和卡方分布。

Deephub 2024-06-09 10:24:20 0 收藏

数据偏度介绍和处理方法

偏度（skewness）是用来衡量概率分布或数据集中不对称程度的统计量。

Deephub 2023-05-29 09:23:40 0 收藏

STATA cox生存模型C-index的比较

// STATA的STATA的STATA的//C指数间差异的假设检验//我自己看的文章，常见的就是一个指标和TNM分期的性能作比较//安装ssc instal somersd//定义模型结果和时间变量stset time, failure(dead==1)//进行cox回归调整其他变量stcox

overfit同步小助手 2023-04-07 13:03:34 0 收藏

环境混合物总体效应：加权分位数和回归（WQS）

加权分位数和(Weighted Quantile Sum, WQS)回归是一种在环境暴露中常见的高维数据集的多元回归的统计模型。该模型允许通过有监督的方式构建一个加权指数，以评估环境暴露的总体效应以及混合物中每一个成分对总体效应的贡献。首先若某一类环境混合物中共有i个component，将每个com

overfit同步小助手 2023-03-31 13:04:33 0 收藏