分布式 - overfit.cn

大数据开发工程师是做什么的？岗位要求高吗？大数据开发工程师要负责数据仓库建设、ETL开发、数据分析、数据指标统计、大数据实时计算平台及业务开发、平台建设及维护等工作内容。熟练掌握数据仓库、hadoop生态体系、计算及二次开发、大数据平台工具的开发：开发平台、调度系统、元数据平台等工具，该岗位对于技术

overfit同步小助手 2022-09-29 08:06:07 0 收藏

客快物流大数据项目（七十八）：Hue简介

HUE是一个开源的。

overfit同步小助手 2022-09-29 08:05:54 0 收藏

kafka是啥？虽然很难学，但是实验入门很简单

Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。kafka的三个基本组成是生产者、消费者、broker（生产者和消费者之间的消息队列服务器）。发布/订阅：消息的发布者不会将消息直接发送给特定的订阅者，而是将发布的消息分为不同的类别，订

overfit同步小助手 2022-09-27 07:05:48 0 收藏

分布式主键生成设计策略

常见的分布式主键生成策略

overfit同步小助手 2022-09-26 09:07:17 0 收藏

湖仓一体电商项目（二十）：业务实现之编写写入DM层业务代码

DM层主要是报表数据，针对实时业务将DM层设置在Clickhouse中，在此业务中DM层主要存储的是通过Flink读取Kafka “KAFKA-DWS-BROWSE-LOG-WIDE-TOPIC” topic中的数据进行设置窗口分析，每隔10s设置滚动窗口统计该窗口内访问商品及商品一级、二级分类分析

overfit同步小助手 2022-09-25 08:02:28 0 收藏

图解Kafka消费者客户端分区分配策略

我们先看一下分区策略的类图/*** 返回序列化后的自定义数据} /*** 分区分配的计算逻辑/*** 当组成员从领导者那里收到其分配时调用的回调} /*** 指明使用的再平衡协议* 默认使用RebalanceProtocol.EAGER协议, 另外一个可选项为 RebalanceProtocol.C

overfit同步小助手 2022-09-24 14:02:34 0 收藏

从零开始搭建虚拟机伪分布式环境（从创建虚拟机一步步教你搭建伪分布式开发环境）。

从零开始搭建伪分布式环境，本人已经测试一遍除了粗心把路径命令打错了别的无任何错误

overfit同步小助手 2022-09-23 07:22:43 0 收藏

RabbitMQ的安装和配置

rabbitMQ的安装和遇到的一些问题

overfit同步小助手 2022-09-21 07:26:16 0 收藏

湖仓一体电商项目（十六）：业务实现之编写写入ODS层业务代码

这里也可以不设置从头开始消费Kafka数据，而是直接启动实时向MySQL表中写入数据代码“RTMockDBData.java”代码，实时向MySQL对应的表中写入数据，这里需要启动maxwell监控数据，代码才能实时监控到写入MySQL的业务数据。以上代码执行后在，在对应的Kafka “KAFKA-

overfit同步小助手 2022-09-20 07:26:18 0 收藏

Kafka 生产者和消费者实例

基于命令行使用Kafka类似scala，mysql等，命令行是初学者操作Kafka的基本方式，kafka的模式是生产者消费者模式，他们之间通讯是通过，一个公共频道完成。指定消费者组ID，在同一时刻同一消费组中只有一个线程可以去消费一个分区数据，不同的消费组可以去消费同一个分区的数据。(查看Kafka

overfit同步小助手 2022-09-18 08:14:27 0 收藏

大数据面试题汇总【持续更新】

基于 RDD 的分布式数据处理实验（pyspark）

深入了解分布式锁导学篇（一）

hadoop伪分布式集群搭建（超详细）

zookeeper实现分布式锁

【精通Spark系列】弹性分布式数据集RDD快速入门篇

Python中RabbitMQ的使用

RabbitMQ：简单模式(Hello World)

MapReduce课程设计-----好友推荐功能

Hadoop集群完全分布式搭建

大数据开发工程师是做什么的？岗位要求高吗？