大数据 - overfit.cn

轻松通关Flink第24讲：Flink 消费 Kafka 数据业务开发

这一课时介绍了 Flink 消费 Kafka 的方式，比如从常用的指定单个或者多个 Topic、消息的序列化、分区的动态发现等，还从源码上介绍了 Flink 消费 Kafka 的原理。通过本课时的学习，相信你可以对 Flink 消费 Kafka 有一个较为全面地了解，根据业务场景可以正确选择消费的方

overfit同步小助手 2023-09-13 07:04:09 0 收藏

Hadoop 集群小文件归档 HAR、小文件优化 Uber 模式

Uber 模式” 是指在 Hadoop 中运行 MapReduce 任务时，将所有的任务（Mapper 和 Reducer）都运行在一个单独的 JVM 进程中，而不是在集群的不同节点上分别启动多个 JVM 进程来运行任务。这个模式的名称来自于 Uber 公司，他们在其 Hadoop 集群上采用了这种

overfit同步小助手 2023-09-13 07:03:56 0 收藏

33、Flink之hive介绍与简单示例

Flink与hive的介绍及简单示例

overfit同步小助手 2023-09-13 06:03:27 0 收藏

【HDFS】NN处理全量块汇报时reportDiff的一些细节

overfit同步小助手 2023-09-13 06:03:12 0 收藏

踩坑（5）整合kafka 报错 java.net.UnknownHostException: 不知道这样的主机

整合kafka 报错 java.net.UnknownHostException: 不知道这样的主机

overfit同步小助手 2023-09-13 03:03:53 0 收藏

14.Kafka系列之K8S部署集群

Apache Kafka 不依赖 Apache Zookeeper的版本，被社区称之为 Kafka Raft 元数据模式，简称KRaft模式。KRaft运行模式的Kafka集群，不会将元数据存储在 Apache ZooKeeper中。即部署新集群的时候，无需部署ZooKeeper集群，因为Kafka

overfit同步小助手 2023-09-13 03:03:44 0 收藏

hadoop3.2.4集成flink 1.17.0

hadoop，flink，集成

overfit同步小助手 2023-09-13 02:03:55 0 收藏

GBase 8a视频配套联系

GBase 8a视频配套练习

overfit同步小助手 2023-09-13 02:03:50 0 收藏

[大数据 Flink,Java实现不同数据库实时数据同步过程]

🌮笔记// 定义Mysql数据库连接信息// 定义查询语句// 定义JDBC连接器.finish();// 读取Mysql数据库中的数据rowTypeInfo表示数据类型信息，需要根据Mysql数据库中的表结构来定义。// 将读取到的数据封装成一个Flink的DataStream程序@Overri

overfit同步小助手 2023-09-13 02:03:46 0 收藏

zookeeper的介绍和用docker搭建zookeeper集群，以及Go语言使用zookeeper

Apache ZooKeeper 是 Apache 软件基金会的一个软件项目，为大型分布式系统提供开源分布式配置服务、同步服务和命名注册。ZooKeeper原本是Hadoop的一个子项目，但现在它本身已经是一个顶级项目了。zookeeper是经典的分布式数据一致性解决方案，致力于为分布式应用提供一个

overfit同步小助手 2023-09-13 02:03:37 0 收藏

win10 hadoop报错 unable to load native-hadoop library

win10 安装hadoop执行hdfs -namenode format 和运行hadoop的start-all报错 unable to load native-hadoop library。(1条消息) 【免费】hadoop3.0.0或者其他版本Unabletoloadnative-hadoop

overfit同步小助手 2023-09-13 01:04:09 0 收藏

4.1、Flink任务怎样读取集合中的数据

Flink任务读取集合中的数据

overfit同步小助手 2023-09-13 01:04:01 0 收藏

工具篇--4 消息中间件-RabbitMq 模型介绍

在这种情况下，如果开启了 mandatory 参数，那么无法匹配到队列的消息就会被视为不可路由，从而触发 ReturnCallback，同时也会在消息到期后被重新路由到延迟队列中，如果在ReturnCallback 方法中重写进行消息的发送，最终会有两条相同的消息，导致该消息被重复消费，这就是同时收

overfit同步小助手 2023-09-13 01:03:52 0 收藏

RabbitMQ输出日志配置

参考地址。

overfit同步小助手 2023-09-12 23:04:06 0 收藏

RabbitMQ实现延迟消息，RabbitMQ使用死信队列实现延迟消息，RabbitMQ延时队列插件

假设有一个业务场景：超过30分钟未付款的订单自动关闭，这个功能应该怎么实现？RabbitMQ使用死信队列，可以实现消息的延迟接收。上面我们了解到，rabbitMQ的消息可以设置过期时间，消息过期后会被直接丢弃，我们可以通过配置死信队列，将这种消息变成死信（Dead Letter），然后将这种过期的消

overfit同步小助手 2023-09-12 23:03:55 0 收藏

数据仓库(数仓)介绍

比如现在的网购，淘宝，京东等等。面向主题的数据组织方式，就是在较高层次上对分析对象的数据的一个完整、一致的描述，能完整、统一地刻划各个分析对象所涉及的企业的各项数据，以及数据之间的联系。这个阶段，主要是按照一定的数据模型，对整个企业的数据进行采集，整理，并且能够按照各个业务部门的需要，提供跨部门的，

overfit同步小助手 2023-09-12 21:04:08 0 收藏

RabbitMQ系列（8）--实现RabbitMQ队列持久化及消息持久化

只需要往basicPublish方法的第三个参数传MessageProperties.PERSISTENT_TEXT_PLAIN，即可对消息进行持久化这个参数能告诉RabbitMQ将消息保存到磁盘里进行持久化处理，但值得注意的是将消息标记为持久化不能完全保证消息不会丢失，因为存在消息刚准备存储到磁盘

overfit同步小助手 2023-09-12 21:03:49 0 收藏

搭建RabbitMQ消息服务，整合SpringBoot实现收发消息

本文首先简单介绍了 RabbitMQ，然后和 Kafka 等热门消息队列进行对比，最后演示了 RabbitMQ 的完整安装配置整合流程，帮助零基础的小白入门 RabbitMQ 开发。

overfit同步小助手 2023-09-12 21:03:34 0 收藏

通过 docker-compose 快速部署 Hive 详细教程

其实通过 docker-compose 部署 hive 是在继上篇文章 Hadoop 部署的基础之上叠加的，Hive 做为最常用的数仓服务，所以是有必要进行集成的，感兴趣的小伙伴请认真阅读我以下内容，通过 docker-compose 部署的服务主要是用最少的资源和时间成本快速部署服务，方便小伙伴学

overfit同步小助手 2023-09-12 20:03:53 0 收藏

MATLAB与大数据：如何应对海量数据的处理和分析

在面对海量数据的处理和分析时，MATLAB是一种强大的工具，它提供了丰富的数据处理、分析和可视化功能，帮助我们高效地应对这一挑战。此外，MATLAB还提供了强大的图像处理工具箱和数据可视化工具，帮助我们处理和展示大规模图像和数据。MATLAB提供了一系列用于处理和分析大数据的工具和函数，这些工具和函

overfit同步小助手 2023-09-12 20:03:45 0 收藏