大数据 - overfit.cn

hive on spark报错:没有发现类

Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create Spark client for Spark session 7abab17

overfit同步小助手 2022-06-07 07:38:21 0 收藏

云计算复习索引

云计算考试复习索引，动态更新

overfit同步小助手 2022-06-07 07:38:17 0 收藏

ML之FE：RFM指标的简介、意义、应用之详细攻略

ML之FE：RFM指标的简介、意义、应用之详细攻略目录RFM指标的简介RFM指标的意义RFM指标的应用在众多的客户关系管理(CRM)的分析模型中，RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该模型通过一个客户的近期交易行为、交易的总体频率以及交易金额三项指标来描

overfit同步小助手 2022-06-07 07:38:14 0 收藏

sql记录之表的创建与删除相关操作

SQL创建表与删除

overfit同步小助手 2022-06-07 07:38:10 0 收藏

Centos下安装Hadoop【历时三天亲测有效】

Centos6.8下安装Hadoop2.7，大致分为三个步骤：①虚拟机环境准备②安装JDK③安装Hadoop前提条件：具备Linux操作系统基础，并且已安装虚拟机。

overfit同步小助手 2022-06-07 07:38:07 0 收藏

Python 数据分析 —— Pandas ②

首先：读入 movie_data.xlsx查看一下前5行数据在做数据分析时，原始数据往往会因为各种各样的原因产生各种数据格式问题。数据格式是我们非常需要注意的一点，数据格式错误往往会造成很严重的后果。并且，很多异常值在我们经过格式转换后才会发现，对我们规整数据，清洗数据有

overfit同步小助手 2022-06-07 07:38:03 0 收藏

互联网大厂数据分析面试常见问题及解法，建议收藏

从面试官的角度沉淀了一些常见的数据分析问题以及问题背后考察的能力，并为大家一一拆解背后的逻辑，助力大家拿offer！

overfit同步小助手 2022-06-06 07:38:59 0 收藏

Spark-Sql RewriteDistinctAggregates

spark sql 优化规则：RewriteDistinctAggregates

overfit同步小助手 2022-06-06 07:38:52 0 收藏

pandas筛选dataframe数据：筛选一个数据列的内容等于某一固定值，而且另一数据列的数值大于固定阈值的所有数据行

pandas筛选dataframe数据：筛选一个数据列的内容等于某一固定值，另一数据列的数值大于固定阈值的所有数据行

overfit同步小助手 2022-06-06 07:38:48 0 收藏

Elasticsearch与MySQL数据同步

方案一：同步调用基本步骤如下：方案二：异步通知流程如下：方案三：监听binlog流程如下：方式一：同步调用方式二：异步通知方式三：监听binlog导入项目完成对酒店数据的【增删改查】实现数据同步操作hotel-admin项目作为酒店管理的微服务。当酒店数据发生增、删、改时，要求对elasticsea

overfit同步小助手 2022-06-06 07:38:42 0 收藏

重学scala：scala函数式编程与高阶函数

谈到编程方式有指令式编程、过程化编程、函数式编程，函数式编程在使用时主要的思想就是把运算过程写成一些列嵌套的函数调用。把一组数据通过函数实现运算转化成另一组数据。函数式编程这种方式在我们将来开发Spark、Flink的业务代码时会大量使用。下面列出了一些我们经常使用的进行函数式编程的Iterable

overfit同步小助手 2022-06-06 07:38:39 0 收藏