Nature子刊:一个从大脑结构中识别阿尔茨海默病维度表征的深度学习框架

脑部疾病的异质性是精准诊断/预后的一个挑战。作者描述并验证了一种名为Smile-GAN(SeMI-supervised cLustEring-Generative Adversarial Network),的半监督深度聚类方法,它研究了与正常大脑结构对比的神经解剖学异质性,从而通过神经影像特征识别疾

【国庆特辑文章】时间序列~动态时间规整(Dynamic Time Wraping)

解决的问题:测量两端时间序列的相似性

【XGBoost】第 7 章:使用 XGBoost 发现系外行星

在本章中,您将穿越星星,尝试以为向导发现系外行星。本章的原因是双重的。首先是使用 XGBoost 在自上而下的研究中获得实践非常重要,因为出于所有实际目的,这就是您通常使用 XGBoost 所做的事情。尽管您可能无法自己发现带有 XGBoost 的系外行星,但您在此处实施的策略(包括选择正确的评分指

softmax回归与交叉熵损失

回归与分类是机器学习中的两个主要问题,二者有着紧密的联系,但又有所不同。在一个预测任务中,回归问题解决的是多少的问题,如房价预测问题,而分类问题用来解决是什么的问题,如猫狗分类问题。分类问题又以回归问题为基础,给定一个样本特征,模型针对每一个分类都返回一个概率,于是可以认为概率最大的类别就是模型给出

贝叶斯回归:使用 PyMC3 实现贝叶斯回归

在这篇文章中,我们将介绍如何使用PyMC3包实现贝叶斯线性回归,并快速介绍它与普通线性回归的区别。

机器学习之手写决策树以及sklearn中的决策树及其可视化

(2)如果属性划分次数达到上限,即属性划分完了,或者是样本中在此类属性取值都一样,可以认为全部划分仍然存在不同类的样本,那么这个节点就标记为类别数占较多的叶节点。划分选择还是比较重要的,因为不同的划分选择会建出不同的决策树。划分选择的指标就是希望叶节点的数据尽可能都是属于同一类,即节点的“纯度”越来

transformers的近期工作成果综述

在本文中,对基于transformer 的工作成果做了一个简单的总结,将最新的transformer 研究成果(特别是在2021年和2022年发表的研究成果)进行详细的调研。

Pytorch创建多任务学习模型

一般来说多任务学的模型架构非常简单:一个骨干网络作为特征的提取,然后针对不同的任务创建多个头。利用单一模型解决多个任务。

单变量时间序列平滑方法介绍

在本文中将介绍和解释时间序列的平滑方法

10种常见的回归算法总结和介绍

线性回归是机器学习中最简单的算法,它可以通过不同的方式进行训练。 在本文中,我们将介绍以下回归算法:线性回归、Robust 回归、Ridge 回归、LASSO 回归、Elastic Net、多项式回归、多层感知机、随机森林回归和支持向量机。

Pytoch优化器常用的两种学习率衰减策略:指数衰减策略、余弦退火策略(附测试代码)

Pytorch提供了多种学习率衰减策略,我在这里介绍常用的指数衰减策略和余弦退火策略,并分别介绍他们的代码实现。无论采用那种策略,在网络训练之间我们均需要进行以下两步工作:1)创建优化器Optimizer;2)为优化器绑定一个学习率控制器Scheduler;网络训练过程中,学习率不能过大,也不能过小

广义加性模型(GAMs)

作为回归家族的一个扩展,广义加性模型(GAMs)是最强大的模型之一,可以为任何回归问题建模!!

数学建模——相关系数

在数理统计中,这里的原假设和备择假设中的𝑟应该改为𝜌, 其中𝜌为未知的总体相关系数,实际上我们关心的是总体的统计特征。(2)在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说他们相关,我们一定要画出散点图来看才行。这里,我们选择正态分

使用可视化工具和统计方法检测异常值

异常值(离群值)是指距离其他数据值太远的数据值。数据异常值可能是自然产生的,也可能是由于测量不准确、或系统故障造成的。与缺失值类似,异常值会破坏数据科学项目并返回错误的结果或预测。

2022年数学建模国赛--赛后总结

2022年全国大学生数学建模比赛已经落下帷幕,每一位坚持到比赛结束的数模人都值得我们去敬佩!数学建模从0到1这次比赛时间依旧十分紧张,三天比赛期间几乎都是两三点睡,六七点起床,不过很庆幸今年状态比较好,能保持三天工作效率正常。我们团队的配合也越来越默契,大家都攥着一股劲儿往前冲。当然这次比赛中也存在

【R语言数据科学】(十七):常见机器学习算法(附代码实现)

之前我们已经介绍了基本的数据导入、预处理、可视化以及如何评估一个模型。接下来我们将介绍一下具体的机器学习算法以及实现过程。在这里提供了一些跨越不同方法的示例。在本章中,我们将使用两个预测数字的数据来演示几种常见分类算法是如何工作的。后续会专门出一个子系列完善各类机器学习算法的实现。

PCA主成分分析算法专题【Python机器学习系列(十五)】

PCA主成分分析算法专题【Python机器学习系列(十五)】文章目录1. PCA简介1.2 python 实现 鸢尾花数据集PCA降维1.3 sklearn库实现 鸢尾花数据集PCA降维案例

使用 Temporal Fusion Transformer 进行时间序列预测

目前来看表格类的数据的处理还是树型的结构占据了主导地位。但是在时间序列预测中,深度学习神经网络是有可能超越传统技术的。

2022数学建模国赛C题详细思路:基于随机森林和灰色关联度分析

问题1使用微分方程模型,建立风化过程中化学成分含量的微分方程模型,(可以参考放射性元素微分方程模型类似建模)。问题2需要对于每个类别选择合适的化学成分对其进行亚类划分,使用随机森林算法划分亚类。问题3根据问题2建立的随机森林模型,预测划分所属类型。问题4分需要析其化学成分之间的关联关系,可以使用灰色