大数据 - overfit.cn

【kafka专栏】不用zookeeper怎么安装kafka集群-最新kafka3.0版本

在kafka3.0中已经可以将zookeeper去掉，kafka集群不再必须依赖zookeeper，这为运维强度的下降提供了非常多的帮助。本文为大家介绍kafka3.0，不用zookeeper如何进行集群的安装。

overfit同步小助手 2023-02-10 09:04:13 0 收藏

史上最全Hashmap面试总结，51道附带答案，持续更新中...

点击上方关注 “终端研发部”设为“星标”，和你一起掌握更多数据库知识我历经两个工作日晚上总结了50道关于hashmap的面试题，我相信，下面将会是Hashmap最全的面试总结！HashMap的底层数据结构？ HashMap底层实现数据结构为数组+链表的形式，JDK8及其以后的版本中使用了数组+链表

overfit同步小助手 2023-02-10 09:04:11 0 收藏

一零零九、Docker搭建全集群环境配置

Docker搭建全集群环境配置

overfit同步小助手 2023-02-10 09:04:06 0 收藏

MQ如何保证消息不丢失？

不能少，就是说不能丢失数据。而且持久化可以跟生产的confirm机制配合起来，只有消息持久化到了磁盘之后，才会通知生产者ack，这样就算是在持久化之前rabbitmq挂了，数据丢了，生产者收不到ack回调也会进行消息重发。消费者消费到了这个数据，然后消费后自动提交了offset，让kafka知道你已

overfit同步小助手 2023-02-10 09:04:03 0 收藏

使用 Amazon EMR 构建您的数据分析平台

Amazon EMR是云上的数据分析平台，通过 Amazon EMR 的图形化或命令行接口，用户可以快速搭建和部署基于 Amazon EC2 实例的数据分析系统，并能动态扩展集群。Amazon EMR 也可以读写其他 AWS 数据存储服务，例如 Amazon S3 和 Amazon DynamoDB

overfit同步小助手 2023-02-10 09:04:00 0 收藏

大数据ClickHouse（十四）：Integration系列表引擎

ClickHouse提供了许多与外部系统集成的方法，包括一些表引擎。这些表引擎与其他类型的表引擎类似，可以用于将外部数据导入到ClickHouse中，或者在ClickHouse中直接操作外部数据源。

overfit同步小助手 2023-02-10 09:03:53 0 收藏

[Hadoop全分布部署]安装JDK、Hadoop

JDK全称Java Development Kit 中文意思是Java 开发工具包即java标准版开发包，是Oracle提供的一套用于开发java应用程序的开发包，它提供编译，运行java程序所需要的各种工具和资源，包括java编译器，java运行时环境，以及常用的java类库等。JRE Java

overfit同步小助手 2023-02-10 09:03:50 0 收藏

湖仓一体电商项目（一）：项目背景和架构介绍

湖仓一体实时电商项目是基于某宝商城电商项目的电商数据分析平台，本项目在技术方面涉及大数据技术组件搭建，湖仓一体分层数仓设计、实时到离线数据指标分析及数据大屏可视化，项目所用到的技术组件都从基础搭建开始，目的在于湖仓一体架构中数据仓库与数据湖融合打通，实现企业级项目离线与实时数据指标分析。在业务方面目

overfit同步小助手 2023-02-10 09:03:47 0 收藏

docker安装rabbitMQ

1.rabbitMQ介绍RabbitMQ是一套开源（MPL）的消息队列服务软件，是由 LShift 提供的一个 Advanced Message Queuing Protocol (AMQP) 的开源实现，由以高性能、健壮以及可伸缩性出名的 Erlang 写成。2. MQ介绍MQ是一个互联网架构中常

overfit同步小助手 2023-02-10 08:04:34 0 收藏

华为云从入门到实战 | 云服务概述与华为云搭建Web应用

云计算在快速发展过程中逐渐形成了不同的服务模式(Service Model)。根据云计算最终服务的交付形态主要分为3种类型，软件即服务、平台即服务与基础架构即服务。从根源上来说，云计算的服务模式来源于面向服务的架构SOA(Service-Oriented Architecture)。所谓SOA，就是

overfit同步小助手 2023-02-10 08:04:31 0 收藏

第10篇：Mac/Windows安装ElasticSearch可视化Head插件

目前国内有大量的公司都在使用 Elasticsearch，包括阿里、京东、滴滴、今日头条、小米、vivo等诸多知名公司。除了搜索功能之外，Elasticsearch还结合Kibana、Logstash、Elastic Stack还被广泛运用在大数据近实时分析领域，包括日志分析、指标监控等多个领域。M

overfit同步小助手 2023-02-10 08:04:28 0 收藏

Hudi学习一：Hudi简介

数据湖-Hudi学习

overfit同步小助手 2023-02-10 08:04:24 0 收藏

洞见云原生|微服务及微服务架构浅析

微服务架构已在云原生架构中发挥着举足轻重的作用，而SpingCloud是我们开发微服务的一整套技术解决方案之一

overfit同步小助手 2023-02-10 08:04:22 0 收藏

Hadoop生态之Mapreduce

Hadoop三板斧之青龙偃月刀MapReduce

overfit同步小助手 2023-02-10 08:04:18 0 收藏

助力工业物联网，工业大数据之脚本开发【五】

Shell：Linux原生Shell脚本，命令功能全面丰富，主要用于实现自动化Linux指令，适合于Linux中简单的自动化任务开发。Python：多平台可移植兼容脚本，自身库功能强大，主要用于爬虫、数据科学分析计算等，适合于复杂逻辑的处理计算场景。脚本目标：实现自动化将多张Oracle中的数据表全

overfit同步小助手 2023-02-10 08:04:13 0 收藏

hive 的 lateral view用法以及注意事项

1. lateral view 简介 hive函数 lateral view 主要功能是将原本汇总在一条（行）的数据拆分成多条（行）成虚拟表，再与原表进行笛卡尔积，从而得到明细表。配合UDTF函数使用，一般情况下经常与explode函数搭配，explode的操作对象（列值）是 ARRAY 或者 M

overfit同步小助手 2023-02-10 08:04:10 0 收藏

【kafka专栏】生产者同步及异步发送数据三种方式

apache kafka生产者客户端三种同步及异步发送数据的方式

overfit同步小助手 2023-02-10 08:04:07 0 收藏

大数据数据库增量日志采集之Canal

canal，译意为水道/管道/沟渠，主要用途是基于 MySQL 数据库增量日志解析，提供增量数据订阅和消费

overfit同步小助手 2023-02-10 08:04:04 0 收藏

大数据ClickHouse（五）：数据库引擎介绍与实例演示

这里不会将MySQL的数据同步到ClickHouse中，ClickHouse就像一个壳子，可以将MySQL的表映射成ClickHouse表，使用ClickHouse查询MySQL中的数据，在MySQL中进行的CRUD操作，可以同时映射到ClickHouse中。在ClickHouse中使用MySQL引

overfit同步小助手 2023-02-10 08:04:01 0 收藏

双目视觉目标追踪及三维坐标获取—python（代码）

通过双目相机实现了物体的目标追踪及三维坐标获取—python（代码）

overfit同步小助手 2023-02-10 08:03:58 0 收藏