大数据 - overfit.cn

基于Hologres+Flink的曹操出行实时数仓建设作者：林震｜曹操出行实时计算负责人

曹操出行创立于2015年5月21日，是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务，以“科技重塑绿色共享出行”为使命，将全球领先的互联网、车联网、自动驾驶技术以及新能源科技，创新应用于共享出行领域，以“用心服务国民出行”为品牌主张，致力于打造服务口碑最好的出行品牌。作为一家互联网出行平台，

overfit同步小助手 2024-01-26 11:03:22 0 收藏

RabbitMQ交换机

Exchange在RabbitMQ中，生产者发送信息不会直接将消息投送到队列中，而是先将消息投递到交换机中，在由交换机转换到具体的队列，队列再将消息以推送或者拉取方式给消费者进行消费。生产者将消息发送到Exchange，由Exchange再路由到一个或多个队列中路由键（RoutingKey）生产者将

overfit同步小助手 2024-01-26 10:03:16 0 收藏

从 AutoMQ Kafka 导出数据到 Databend

作者：韩山杰Databend Cloud 研发工程师是使用 Rust 研发、开源的、完全面向云架构、基于对象存储构建的新一代云原生数据仓库，为企业提供湖仓一体化、计算和存储分离的大数据分析平台。本文将介绍如何通过将数据从 AutoMQ for Kafka 导入 Databend。本文中提及的 Au

overfit同步小助手 2024-01-26 09:03:51 0 收藏

zookeeper 与eureka区别

overfit同步小助手 2024-01-26 08:03:48 0 收藏

kafka（一：分区数据不均衡（数据倾斜），分区分配策略）

可以设置一个新的列，根据这个列进行hash。

overfit同步小助手 2024-01-26 07:03:47 0 收藏

【Kafka-3.x-教程】-【五】Kafka-监控-Eagle

Kafka-Eagle 框架可以监控 Kafka 集群的整体运行情况，在生产环境中经常使用。1）MySQL 环境准备Kafka-Eagle 的安装依赖于 MySQL，MySQL 主要用来存储可视化展示的数据。如果集群中之前安装过 MySQL 可以跨过该步。

overfit同步小助手 2024-01-26 07:03:20 0 收藏

深入理解Spring Kafka中@KafkaListener注解的参数与使用方式

Apache Kafka作为一个强大的消息代理系统，与Spring框架的集成使得在分布式应用中处理消息变得更加简单和灵活。Spring Kafka提供了注解，为开发者提供了一种声明式的方式来定义消息监听器。在本文中，我们将深入探讨注解的各种参数以及它们的使用方式，帮助读者更好地理解和使用Spring

overfit同步小助手 2024-01-26 06:03:34 0 收藏

Flink面试知识点：JobManager 和 Task

好迷茫，三本软件工程大三了，才刚学了Spring框架而且还没像样的项目，之前学校还学了python和安卓（很基础），以这个学习进度，下学期想找份像样的实习入行，俺也来试试牛爱网98男，身高173，体重65，河南人在上海读研，已签约上海某大厂，长相帅的一批。收到了快手offer，但开的不满意，想签一个

overfit同步小助手 2024-01-26 06:03:31 0 收藏

拥抱docker拥抱大数据——安装

一、Windows10专业版进入网址点击下载。

overfit同步小助手 2024-01-26 06:03:21 0 收藏

flink1.13环境搭建

overfit同步小助手 2024-01-26 04:03:36 0 收藏

第二章 Eureka服务注册与发现

在传统的rpc远程调用框架中，管理每个服务与服务之间依赖关系比较复杂，管理比较复杂，所以需要使用服务治理，管理服务于服务之间依赖关系，可以实现服务调用、负载均衡、容错等，实现服务发现与注册。

overfit同步小助手 2024-01-26 03:03:10 0 收藏

Spark基础学习--基础介绍

Spark是可以处理大规模数据的统一分布式计算引擎。

overfit同步小助手 2024-01-26 02:03:37 0 收藏

SparkStreaming与Kafka整合

Receiver方式基于kafka的高级消费者API实现（高级优点：高级API写起来简单；不需要去自行去管理offset，系统通过zookeeper自行管理；不需要管理分区，副本等情况，系统自动管理；消费者断线会自动根据上一次记录在 zookeeper中的offset去接着获取数据；高级缺点：不能自

overfit同步小助手 2024-01-26 01:03:37 0 收藏

【大数据】安装 Zookeeper 单机版

点击 Download 即可下载，这里我们选择的版本是 3.5.10，下载之后扔到服务器上。由于 Zookeeper 是基于 Java 语言编写的，所以还需要安装 JDK，这里我使用的是 JDK1.8，都已经已经安装好了，并配置了环境变量。

overfit同步小助手 2024-01-26 01:03:32 0 收藏

flink1.17部署模式和部署方法

Apache Flink是一个框架和分布式处理引擎，用于对无边界和有边界的数据流进行有状态的计算。Flink被设计为可以在所有常见集群环境中运行，并能以内存速度和任意规模执行计算。目前市场上主流的流式计算框架有Apache Storm、Spark Streaming、Apache Flink等，但能

overfit同步小助手 2024-01-25 23:03:37 0 收藏

Eureka工作原理详解

Eureka采用了C-S架构，即客户端-服务器端架构，其中服务提供者（Provider）将自己的信息注册到Eureka服务器端，同时从服务器端获取其他服务的信息。然而，随着Dubbo框架的不断开发优化，以及各种注册中心组件的诞生，即使是RPC框架，现在的注册中心也逐步多样化。Eureka、ZooKe

overfit同步小助手 2024-01-25 22:03:35 0 收藏

rabbitmq的介绍、使用、案例

rabbitmq的基础理论就是生产者和消费者模型，在这里进行解释，方便对rabbitmq进行理解和使用。生产者和消费者模型是分为以下几个要素：共享缓冲区、生产者、消费者。下面以去kfc买鸡腿举例：就是顾客要买鸡腿，肯定是需要去店里去买的，只有店员在炸好鸡腿之后，顾客点餐买好鸡腿。炸鸡腿的店员和顾客是

overfit同步小助手 2024-01-25 21:03:48 0 收藏

大数据和机器学习：从基础到高级

1.背景介绍大数据和机器学习是当今最热门的技术领域之一，它们在各个行业中发挥着重要作用。大数据技术可以帮助我们从海量数据中发现隐藏的模式和关系，从而为决策提供数据驱动的依据。机器学习则是一种人工智能技术，它可以让计算机自动学习和改进其行为，从而提高效率和准确性。本文将从基础到高级的角度，详细介绍大数

overfit同步小助手 2024-01-25 21:03:43 0 收藏

Kafka入门基本概念（详细）

Kafka是一种高吞吐量的分布式发布订阅消息系统（消息引擎系统），它可以处理消费者在网站中的所有动作流数据。这种动作（网页浏览，搜索和其他用户的行动）是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。对于像Hadoop一样的日志数据和离线分析系

overfit同步小助手 2024-01-25 21:03:15 0 收藏

任务15：使用Hive进行全国气象数据分析

任务描述任务指导。

overfit同步小助手 2024-01-25 20:03:51 0 收藏