100+数据科学面试问题和答案总结 - 基础知识和数据分析

来自Amazon,google,Meta, Microsoft等的面试问题,问题很多所以对问题进行了分类整理,本文包含基础知识和数据分析相关问题

利用Python制作本地Excel的查询与生成的程序

目录前言需求实验步骤Excel预览图片查询追加查询结果到Excel完整代码大家好 我是毕加锁(锁!) 今天教大家利用Python制作本地Excel的查询与生成的程序制作一个程序 有一个简单的查询入口 实现Excel的查询与生成1打开一个exe 弹出一个界面 2有一个查询 卡号 点击查询3下方展示查询

如何比较两个或多个分布:从可视化到统计检验的方法总结

比较一个变量在不同组中的分布是数据科学中的一个常见问题,在这篇文章中,我们将看到比较两个(或更多)分布的不同方法,并评估它们差异的量级和重要性。

Python 数据分析 —— Matplotlib ①

    matplotlib 是一个 Python 的 2D 图形包。pyplot 封装了很多画图的函数。  导入相关的包:   包含一系列类似 MATLAB 中绘图函数的相关函数。每个 matplotlib.pyplot 中的函数对当前的图像进行一些修改,例如:产生新的图像,在图像中产生新的绘图区

14个面试中常见的概率问题

在任何数据科学面试中,基本上都会问道一些有关概率的问题。 这在本文中我总结了一些相关的问题供大家参考。

90个Numpy的有用的代码片段

这些有用的片段在面试中会经常出现,也可以作为日常的numpy练习。

在 Pandas 中使用 Merge、Join 、Concat合并数据的效率对比

在 Pandas 中有很多种方法可以进行DF的合并。本文将研究这些不同的方法,以及如何将它们执行速度的对比。

四大名著知识图谱可视化

​四大名著人物关系分析实践,通过知识图谱可视化,从二维视觉突破到2.5维视觉,整体提升数据关系感知能力。​​

520还不知道选啥礼物?让AHP帮你选一个最符合你的吧~(附Python代码

520了,不管是男码,女码友,都应该收到一份示爱,也希望各位单身码友今年脱单,不单身的码友和另一半感情越来越好,不管在什么地方都有人爱你,我爱你们~

基于聚类算法的城市餐饮数据分析与店铺选址

餐饮业生意好坏的影响因素通常有很多,包括店铺菜系、口味、服务态度、周边环境、人口密度、所在区域、人均消费等等方面。本项目以上海城市为例,对其餐饮业消费数据进行统计分析,从三个维度“口味”、“人均消费”、“性价比”对不同菜系进行横向比较。针对某一商铺类型,将上海划分成格网空间,做空间指标评价,基于聚类

matplotlib进阶教程:如何逐步美化一个折线图

大家好,今天分享一个非常有趣的 Python 教程,如何美化一个 matplotlib 折线图,喜欢记得收藏、关注、点赞。注:数据、完整代码、技术交流文末获取1. 导入包import pandas as pdimport matplotlib.pyplot as pltimport matplotl

统计学小抄:常用术语和基本概念小结

统计学是涉及数据的收集,组织,分析,解释和呈现的学科。

1行代码完成可视化:Seaborn3个常用方法示例

只需一行 Seaborn 代码,我们就能够创建最常用的绘图并对其进行自定义,这是我们将在本文中重点介绍的内容。

飞猪平台用户行为分析—python

文章目录一、项目背景1.1数据来源1.2数据介绍二、分析目的三、分析思路四、数据分析3.1数据清洗3.2用户分析3.2.1用户维度3.2.1.1浏览量pv、访客量uv、成交量分析五、总结提示:本项目分析仅用来学习使用一、项目背景作为中国最受欢迎的在线旅游平台(OTP)之一,阿里巴巴集团旗下的飞猪通过

机器学习实战 -朴素贝叶斯

贝叶斯分类算法是统计学的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。所以称之为”朴素”,是因为贝叶斯分类只做最原始、最简单的假设:所有的特征之间是统计独立的。

一文速学-Pandas处理缺失值操作各类方法详解

前言匆忙之间在CSDN上连载博客已有三年之久,现在已临近毕业。回顾大学的四年尽是不甘,意难平。有时反思良久,或许是我对自己的定位还不够明确,还不知道自己想要的是如此模糊,也许接受现实是对理想主义者最大的冲击。以上是博主突然有感而言,现在回归博客主题。使用Pandas进行数据预处理时需要了解Panda

集成学习-装袋法和提升法

集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通 过在数据上构建多个模型,集成所有模型的建模结果。目录前言一、集成学习是什么?二、装袋法Bagging1.随机森林-代表集成学习技术水平的算法(有放回的抽样bagging)1.1 简介

数据科学 机器学习系列2 机器学习的公平性

在本文中您将学习到0 提高对机器学习中公平性重要性的认识。1 了解与公平相关的危害2 了解不公平评估和缓解措施。

python数据分析基础010 -利用pandas带你玩转excel表格(终篇)

带你玩转excel表格,建议收藏!!