大数据 - overfit.cn

大数据必学Java基础（一百二十二）：POM模式-Maven工程关系

依赖路径长度是一样的的时候，第一原则不能解决所有问题，比如这样的依赖关系：A–>B–>Y(1.0)，A–>C–>Y(2.0)，Y(1.0)和Y(2.0)的依赖路径长度是一样的，都为2。一般的，这些项目的所有依赖都会加入到项目中，或者从父项目继承，或者通过传递性依赖。在创建聚合工程的过程中，总的工程必

overfit同步小助手 2023-02-10 08:03:55 0 收藏

30分钟掌握 Hive SQL 优化（解决数据倾斜）

如果joinkey有集中的空值热点值，这些空值会聚集到少数个分区中，导致长尾问题。

overfit同步小助手 2023-02-10 08:03:52 0 收藏

Maven项目构建工具

** Maven项目对象模型(POM)，可以通过一小段描述信息来管理项目的构建，报告和文档的项目管理工具软件。**Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Ma

overfit同步小助手 2023-02-10 07:04:12 0 收藏

Xshell连接不上虚拟机的解决办法

xshell连接不上虚拟机的方法

overfit同步小助手 2023-02-10 07:04:09 0 收藏

ES和Kibana设置账号密码

命令执行后，会出现几句英文，大概的意思是：你如果确定开启密码的话，需要设置以下六种账户的密码elastic、apm_system、kibana、logstash_system、beats_system、remote_monitoring_user。第四步：重启后，输入kibana的访问地址：http

overfit同步小助手 2023-02-10 07:04:06 0 收藏

HiveSQL源码之语法词法编译文件解析一文详解

工欲善其事必先利其器，首先要了解HiveSQL的编译语法的流程，还是需要懂得HiveSQL的执行流程以及编译规则。Hive详解以及CentOS下部署Hive和Mysql我们现在主要研究SQL Parser语法解析这块内容。语法解析可以说是研究一门编程语言的基础了，我们编程语言本身就是告诉计算机要帮助

overfit同步小助手 2023-02-10 07:04:03 0 收藏

【云原生】3.1 Kubernetes平台安装KubeSpher

选择4核8G（master）、8核16G（node1）、8核16G（node2）三台机器，按量付费进行实验。假设你的机器没有安装Docker、没有安装Kubernetes、没有集群，那么可以看看之前写的文章，那里面有讲解，这里就直接从前置环境开始讲解吧。.........

overfit同步小助手 2023-02-10 07:04:00 0 收藏

[Hadoop全分布部署]配置网络(IP、网关和DNS等)和防火墙

配置网络(IP、网关和DNS等)和防火墙1.1 查看服务器的 IP 地址1.2 设置服务器ip地址1.3 重启网络1.4 pingwww.baidu.com看是否能联网1.5 修改服务器的主机名称1.6 绑定主机名与 IP 地址1.7 关闭防火墙1.8 创建hadoop用户

overfit同步小助手 2023-02-10 07:03:57 0 收藏

微信支付及支付回调

实现微信支付功能，完成支付回调接口，实现内网穿透功能，实现webSocket消息推送功能，完成显示支付结果

overfit同步小助手 2023-02-10 07:03:51 0 收藏

kafka安装部署

一、安装kafka下载kafka两种方式（1）、手动下载下载地址：Apache Kafka（2）、也可以用命令下载（直接下载到服务器哦！）：将安装包下载到/opt/monitor/kafka文件夹下面下载命令： wget http://mirrors.hust.edu.cn/apache/k

overfit同步小助手 2023-02-10 07:03:46 0 收藏

大数据ClickHouse（二）：多种安装方式

https在官网中可以看到ClickHouse可以基于多种方式安装，rpm安装、tgz安装包安装、docker镜像安装、源码编译安装等。这里我们使用rpm安装包安装。如果服务器不支持SSE4.2指令集，则不能下载预编译安装包，需要通过源码编译特定版本进行安装。一、rpm安装包下载https这里需要在

overfit同步小助手 2023-02-10 07:03:43 0 收藏

大数据ClickHouse（八）：MergeTree系列表引擎之MergeTree（重点掌握）

在所有的表引擎中，最为核心的当属MergeTree系列表引擎，这些表引擎拥有最为强大的性能和最广泛的使用场合。对于非MergeTree系列的其他引擎而言，主要用于特殊用途，场景相对有限。而MergeTree系列表引擎是官方主推的存储引擎，有主键索引、数据分区、数据副本、数据采样、删除和修改等功能，支

overfit同步小助手 2023-02-10 07:03:36 0 收藏

【微服务】Eureka注册中心

此文涉及Eureka的结构和作用、如何搭建eureka-server服务、服务注册、服务发现等内容。

overfit同步小助手 2023-02-10 06:04:17 0 收藏

SSH免密登录配置

SSH无密登录配置

overfit同步小助手 2023-02-10 06:04:08 0 收藏

没错，列式存储非常牛。但是，Ta还可以更高效

采用列存可以只读取需要的列，在总列数较多、计算涉及的列较少时，能减少硬盘访问量，提高性能。但仅此还不够，列存数据仓库还要在数据压缩、多线程并行和查找计算等方面做优化以将列存的效果做到最佳。...

overfit同步小助手 2023-02-10 06:04:05 0 收藏

【SpringCloud微服务】- Eureka服务注册与服务发现Discovery

Eureka是Netflix开发的服务发现框架，本身是一个基于REST的服务，主要用于定位运行在AWS域中的中间层服务，以达到负载均衡和中间层服务故障转移的目的。SpringCloud将它集成在其子项目spring-cloud-netflix中，以实现SpringCloud的服务发现功能。和。在应用

overfit同步小助手 2023-02-10 06:03:52 0 收藏

湖仓一体电商项目（三）：3万字带你从头开始搭建12个大数据项目基础组件

在node1、node2、node3节点上/etc/clickhouse-server/config.d路径下下配置metrika.xml文件，默认clickhouse会在/etc路径下查找metrika.xml文件，但是必须要求metrika.xml上级目录拥有者权限为clickhouse，所以这

overfit同步小助手 2023-02-10 06:03:44 0 收藏

大数据ClickHouse进阶（一）：ClickHouse使用场景和集群安装

服务端的配置文件目录，包括全局配置config.xml 和用户配置users.xml。

overfit同步小助手 2023-02-10 06:03:39 0 收藏

大数据行业如何获取高薪岗位offer？

在互联网行业需要保持不断的学习。学习大数据先思考自身未来想往哪个方向发展，想要入门快、基础深厚，并且需求多应用广建议从JAVA开始学起，找到适合自己的学习方法。大数据行业人才稀缺，据第三方统计2020年全国招收程序员394699人，全国程序员平均工资14K，工资中位数12K，其中96%的人的工资介于

overfit同步小助手 2023-02-10 05:04:16 0 收藏

RabbitMQ:工作队列模式

任务队列）背后的主要思想是避免立即执行资源密集型任务并等待其完成。相反，我们将任务安排在以后完成。我们将_任务_封装为消息并将其发送到队列。在后台运行的工作进程将弹出任务并最终执行作业。当您运行多个工作线程时，任务将在它们之间共享。这个概念在 Web 应用程序中特别有用，因为在 Web 应用程序中，

overfit同步小助手 2023-02-10 05:04:13 0 收藏