大数据 - overfit.cn

2020年数学建模国赛B题穿越沙漠

数学建模2020年B题穿越沙漠的模型准备

overfit同步小助手 2023-05-26 14:04:25 0 收藏

大数据技术之Hadoop-入门

Hadoop Distributed File System，简称HDFS，是一个Hadoop分布式文件系统。1）NameNode（老板）：负责数据存在什么位置，整个数据的存储情况。2）DataNode：负责数据具体存在哪，存的什么信息。3）2NN（秘书）：备份，辅助NameNode工作，防止Nam

overfit同步小助手 2023-05-26 14:04:15 0 收藏

Hive中的map类型及其操作

在k-v对中，若value有多个值的情况，如 {‘k1’:‘01,02,03’} ，如果要用 ‘k1’ 中 '02’作为过滤条件，则语句如下：（这里用到split来处理）判断map中是否包含某个key值：array_contains(map_keys(k_v),‘A’)或者k_V[“A”] is n

overfit同步小助手 2023-05-26 14:04:08 0 收藏

Spark on Yarn 部署模式运行常用参数和认证参数理解

spark 提交任务参数说明

overfit同步小助手 2023-05-26 14:03:55 0 收藏

实习证明| 大数据在线实习项目意义

实习以企业真实项目为场景，充分感受真实的大数据挖掘过程及其所需要的技能和知识点。

overfit同步小助手 2023-05-26 09:04:18 0 收藏

五-1、elasticsearch集群搭建(ES集群搭建)

从零到一，elasticsearch搭建集群

overfit同步小助手 2023-05-26 08:03:50 0 收藏

Hive优化总结

一、SQL本身的优化1、只select需要的列，避免select *2、where条件写在子查询中，先过滤再关联3、关联条件写在on中，而不是where中4、数据量大时，用group by代替count distinct5、数据量小时，用in代替join6、避免笛卡尔积7、join时大表放后面，使用

overfit同步小助手 2023-05-26 07:04:04 0 收藏

简单谈谈Feign

本文只是简单粗略的分析一下feign的过程原理

overfit同步小助手 2023-05-26 07:03:52 0 收藏

Elasticsearch并发写入版本冲突解决方案

overfit同步小助手 2023-05-26 07:03:48 0 收藏

RabbitMQ：从入门到实践

RabbitMQ是一款开源的、基于AMQP协议的消息队列系统，用于构建可扩展、高性能、松耦合的分布式系统。支持多种语言和平台：Java、Python、Ruby、.NET等提供丰富的交换器类型和路由策略：直接、广播、主题和头支持消息持久化和高可用性：保证消息不丢失，服务可用性提供管理界面和监控插件：方

overfit同步小助手 2023-05-26 06:03:34 0 收藏

Kafka与Mysql的组合使用（Windows中）

4.创建student表：create table student(sno varchar(10),sname varchar(20),ssex char(2),sage int(5));第一条： insert into student values("95001","John","M",23);第

overfit同步小助手 2023-05-26 05:04:09 0 收藏

2021 大数据应用开发Java 1+x中级实操题答案汇总--含3篇

2021 大数据应用开发Java 1+x中级实操题答案汇总–含3篇2021实操题答案20211030 1+X 中级实操考试样题20211127 1+X 中级实操考试样题20210620 1+X 中级实操考试样题结语2021实操题答案食用须知：答案是我自己试过运行了的，不能说是最正确的答案，仅供参考哈

overfit同步小助手 2023-05-26 05:03:51 0 收藏

毕业设计基于大数据的高校校园学生一卡通数据分析

今天学长向大家介绍一个数据分析项目基于大数据的高校校园学生一卡通数据分析基于国内某高校校园一卡通系统一个月的运行数据，使用数据分析和建模的方法，挖掘数据中所蕴含的信息，分析学生在校园内的学习生活行为为了将学生的整体校园消费行为进行分类，选择了当月消费总金额，消费次数，卡内存款作为特征进行聚类，采用的

overfit同步小助手 2023-05-26 04:04:07 0 收藏

sqllineage解析sql列级血缘并提交到datahub

通过sqllineage获取指定sql文件中HiveSQL的字段级血缘关系，并将结果提交到datahub

overfit同步小助手 2023-05-26 04:03:58 0 收藏

Hbase/Hive知识概要

hbase，hive

overfit同步小助手 2023-05-26 04:03:46 0 收藏

java jdk1.8.0_221 安装步骤

安装前准备工作，D盘新建文件夹JAVA，在JAVA文件夹中新建两个文件夹：jdk和jre。JDK安装会先后安装jdk和jre，更改对应的文件夹位置即可。[jdk文件下会默认安装jre，因此，安装包进行安装jre时不能选择和jdk相同的文件夹]下载完成，双击jdk-8u221-windows-x64.

overfit同步小助手 2023-05-26 03:03:57 0 收藏

2万字硬核spark源码精讲手册

spark源码精讲，结合企业级开发和面试实战重点关注内容

overfit同步小助手 2023-05-26 02:03:51 0 收藏

阿里大数据平台组件

阿里云计算大数据组件

overfit同步小助手 2023-05-26 00:04:11 0 收藏

山东大学软件学院2022-2023数据仓库数据挖掘期末考试（回忆版）

overfit同步小助手 2023-05-25 19:04:15 0 收藏

资产配置（理论+模型），科学找圣杯

大类资产配置主流模型包括恒定比例配置模型、Markowitz均值方差模型（MVO）、Black-Litterman模型、风险平价模型、风险预算模型。

overfit同步小助手 2023-05-25 18:04:40 0 收藏