为什么中位数(大多数时候)比平均值好
开始我的数据分析冒险之旅,我发现了解数据描述的主要统计方法是非常必要的。当我深入研究时,我意识到我很难理解为给定的数据选择哪个集中趋势指标有三种:平均值,中位数和众数
自动美化你的Matplotlib ,使用Seaborn控制图表的默认值
如果您曾经在 Python 中进行过数据可视化,那么很可能您使用了 Matplotlib 库。
在Python中用Seaborn美化图表的3个示例
本篇文章可以看作是上篇文章的延续,对于想美化自己图表的小伙伴可以看看。
机器学习中评估分类模型性能的10个重要指标
在这篇文章中,我们将学习10个最重要的模型性能度量,这些度量可用于评估分类模型的模型性能。以下是我们将通过示
15个能使你工作效率翻倍的Jupyter Notebook的小技巧
概述在数据科学界,Jupyter Notebook是一个受欢迎的工具,采用率很高。本文旨在分享一些很酷的技巧
DevOps与机器学习的集成:使用Jenkins自动调整模型的超参数
Jenkins是真的好用
使用假设检验分析PS4,XBox,Switch 谁是最好的游戏主机
假设检验,一劳永逸
Adam 优化算法详解
选择优化算法可能是在数分钟,数小时或数天(有时甚至是数周)内获得高质量结果的区别
算法大赛神器:集成学习方法关键点介绍
本文的目的是介绍集成学习方法的各种概念。将解释一些必要的关键点,以便读者能够很好地理解相关方法的使用,并能够
DNN、CNN和RNN的12种主要dropout方法的数学和视觉解释
深入研究DNN,CNN和RNNDropout方法 进行正则化,蒙特卡洛不确定性和模型压缩动机在(深度)机器学
机器学习模型生产环境部署的四种系统架构总结
本文将从简单到复杂介绍典型架构的特点以及其优缺点。
推荐系统的PMF - 概率矩阵分解和协同过滤
自动化推荐系统通常用于根据现有的偏好数据为用户提供他们感兴趣的产品建议。文献中通常描述了不同类型的推荐系统。
使用Numpy进行深度学习中5大反向传播优化算法的性能比较
在本文中,我们将通过计算二次凸函数的最优点来比较主要的深度学习优化算法的性能。
极限学习机 Extreme Learning Machines 介绍
极限学习机(ELM, Extreme Learning Machines)是一种前馈神经网络
为文本摘要模型添加注意力机制:采用LSTM的编解码器模型实现
摘要是自然语言处理领域中最具挑战性和最有趣的问题之一。它是一个从多种文本资源(如书籍、新闻文章、博客文章、
通俗易懂的讲解奇异值分解(SVD)和主成分分析(PCA)
通俗易懂的讲解奇异值分解(SVD)和主成分分析(PCA)
5种常用的交叉验证技术,保证评估模型的稳定性
Kaggle的数据科学黑客大会最有趣和最具挑战性的一件事是:在公共和私有的排行榜中,努力保持同样的排名。
循环生成网络 CycleGan 原理介绍
本文旨在解释“循环生成网络 CycleGan ”的内部工作原理,以及如何将其应用于解决现实世界中的任务。
从LeNet到EfficientNet:CNN的演变和特点总结
这是一个了解CNN主流变化和特点的旅程。
通过三个直观步骤理解ROC曲线
ROC曲线是一个分类模型效果好坏评判的的可视化表示。在这篇文章中,我将分三个步骤头开始构建ROC曲线。