精度是远远不够的:如何最好地评估一个分类器?
分类模型(分类器)是一种有监督的机器学习模型,其中目标变量是离散的(即类别)。评估一个机器学习模型和建立模型一样重要。
具有异构元数据的卷积神经网络:CNN元数据处理方式回顾
尽管CNN擅长从摄像机图像(或视频剪辑形式的序列)中提取信息,但我们毕竟不断遇到各种不适合卷积神经网络的元数据。回顾一下最近文献中提出的使用卷积神经网络处理元数据的不同方式。
解决过拟合:如何在PyTorch中使用标签平滑正则化
在训练深度学习模型的过程中,过拟合和概率校准(probability calibration)是两个常见的问题。有没有一种方法可以同时解决过拟合和模型过度自信呢?
机器学习项目模板:ML项目的6个基本步骤
每个机器学习项目都有自己独特的形式。对于每个项目,都可以遵循一组预定义的步骤。尽管没有严格的流程,但是可以提出一个通用模板。
Python实现固定效应回归模型实现因果关系推断
众所周知,“相关并不意味着因果关系”。 相关可以表示因果关系,但需要一定条件。在本文中,我将以一种易于理解的方式对其进行总结。 我将解释如果不满足这些条件为什么标准的普通最小二乘(OLS)无法确定因果关系。
神奇的Batch Normalization 仅训练BN层会发生什么
到目前为止,我从未将批标准化(BN)层视为学习过程本身的一部分,仅是为了帮助深度网络实现优化和提高稳定性。 经过几次实验发现了BN层的作用
机器学习的统计方法 贝叶斯决策理论入门(公式修正版)
无论你是在建立机器学习模型还是在日常生活中做决定,我们总是选择风险最小的方案。然而,机器学习模型最初并不是基于这种理解而建立的。
利用数据可视化和相关历史背景分析在COVID-19影响下美国股市暴跌
在本文中,我将使用数据科学的手段来量化2020年美国股市下跌的影响,并将其与近期(以及更早)历史上的其他主要下跌进行比较。我将收集数据来帮助构建我的模型,设置比较统计来提供背景,并通过可视化来传达重要的想法。
使用GAN绘制像素画,用机器学习的方式协助绘画者更快地完成作品
像素绘画是视频游戏中最受欢迎的美学之一。 它致力于重现任天堂和Arcade旧游戏的外观。假设使用机器学习模型可以生成阴影和彩色图片,那么生成的精灵必须足够好,以至于人类绘画者可以用比从头开始绘制更少的时间来完善它。
使用PyTorch Lightning构建轻量化强化学习DQN(附完整源码)
本文旨在探究将PyTorch Lightning应用于激动人心的强化学习(RL)领域。在这里,我们将使用经典的倒立摆gym环境来构建一个标准的深度Q网络(DQN)模型,以说明如何开始使用Lightning来构建RL模型。
使用机器学习和Python揭开DNA测序神秘面纱
基因组是生物体中DNA的完整集合。作为数据驱动的科学,基因组学广泛地利用机器学习来捕获数据中的关系并推断出新的生物学假设。在本文中,我们将了解如何解释DNA结构以及如何使用机器学习算法来建立DNA序列数据的预测模型。
假新闻无处不在:我创建了一个通过深度学习的方法标记假新闻的开源项目
虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为一名侦探,负责在发布前确定帖子是否真实。但是,虚假新闻仍然会越过我们的防线。本文通过NLP的处理方法,测试RNN,LSTM,GPT2,BERT等模型,创建出一个标记假新闻的开源项目
梯度下降算法数学原理讲解和Python代码实现
在本文中,我们将看到几种基本的优化算法,在机器学习的背景下直接看到这些算法,我们难免会感到困惑。因此,我认为最好不要在任何背景下查看这些算法,以便更好地理解这些方法。
在Python中使用K-Means聚类和PCA主成分分析进行图像压缩
在这片文章中会介绍k-means和PCA的主要原理,并且尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。
通过 Python 代码实现时间序列数据的统计学预测模型
在本篇中,我们将展示使用 Python 统计学模型进行时间序列数据分析。 根据两年以上的每日广告支出历史数据,提前预测两个月的广告支出金额。
不需要锚框:一种全卷积 One-Stage 目标检测算法(FCOS)
本文来源于 ICCV'19 上发表的一种新的目标检测技术 FCOS :全卷积 One-Stage 目标检测算法。该算法提出了一种非常直观和简单的方法来解决目标检测问题,本篇文章是对该算法的总结。
时间序列分析应用:在COVID-19时期预测苹果股票
我们将通过时间序列分析预测最近几个月受油和Covid-19影响的苹果价格,关键点在于简单
在python中使用SageMaker Debugger进行机器学习模型的开发调试
机器学习开发人员和数据科学家并没有享受到传统软件所提供的强大的调试工具。在这篇文章中主要介绍如何通过Amazon SageMaker Debugger进行机器学习模型的开发调试。
如何用Python计算特征重要性?
特征重要性评分是一种为输入特征评分的手段,其依据是输入特征在预测目标变量过程中的有用程度。特征重要性在预测建模项目中起着重要作用,包括提供对数据、模型的见解,以及如何降维和选择特征,从而提高预测模型的的效率和有效性
机器学习的数学:为什么对数如此重要
如果你住在一栋楼的10层,你会选择走楼梯还是乘电梯。这两种选择的目的都是一样的:在漫长的一天工作之后,你想回