大数据 - overfit.cn

使用java写一个对接flink的例子

方法生成 1000 个从 0 到 999 的数字作为模拟数据，将它们转化为字符串并拼接成键值对，然后使用 Flink 的 Kafka 生产者将数据写入到 Kafka 的。方法开启了检查点，并设置了检查点间隔和模式。它使用了 Flink 的 Kafka 消费者从 Kafka 主题。中读取数据，然后将每

overfit同步小助手 2023-08-20 09:04:27 0 收藏

DataX将MySQL数据同步到HDFS中时，空值不处理可以吗

DataX将MySQL数据同步到HDFS中时，空值存到HDFS中时，默认是存储为\N，这样会有两个缺点：参考文章：

overfit同步小助手 2023-08-20 05:04:12 0 收藏

Flink CDC 详解

Flink CDC介绍

overfit同步小助手 2023-08-20 05:04:03 0 收藏

SpringCloud Gateway网关多路由配置访问404解决方案

网关中如果有 spring-boot-starter-actuator、spring-boot-starter-web 依赖，删除。启动类没有直接写在主包下面，而是写在了子包下面，需要在启动类加上@ComponentScan(“xxx”)，xxx一定是你的主包名。配置 filters: - Stri

overfit同步小助手 2023-08-20 04:04:27 0 收藏

谈谈 Kafka 的幂等性 Producer

使用消息队列，我们肯定希望不丢消息，也就是消息队列组件，需要保证消息的可靠交付。消息交付的可靠性保障，有以下三种承诺：最多一次、至少一次和精确一次。

overfit同步小助手 2023-08-20 03:04:19 0 收藏

Rabbitmq死信队列及延时队列实现

RabbitMQ、死信队列、TTL、x-dead-letter-exchange、x-message-ttl

overfit同步小助手 2023-08-20 02:04:26 0 收藏

【RabbitMQ】Linux系统服务器安装RabbitMQ

这是RabbitMQ的管理界面（Management UI）的默认端口号。通过浏览器访问 http://:15672（或者本地访问 http://localhost:15672）可以打开RabbitMQ的管理界面。在该界面上，您可以监视和管理RabbitMQ服务器、查看队列、交换器、绑定等信息，以及

overfit同步小助手 2023-08-20 02:04:18 0 收藏

六、数据仓库详细介绍（ETL）方法篇

上文我们把数据仓库类比我们人类自身，数据仓库“吃”进去的是原材料（原始数据），经过 ETL 集成进入数据仓库，然后从 ODS 开始逐层流转最终供给到数据应用，整个数据流动过程中，在一些关键节点数据会被存储存储下来落入数仓模型。在数仓这个自运转的大生态系统中 ETL 扮演了原材料加工转化和能量传输两个

overfit同步小助手 2023-08-20 02:04:10 0 收藏

RabbitMQ - 简单案例

overfit同步小助手 2023-08-20 01:04:43 0 收藏

RabbitMQ实现延迟队列

RabbitMQ 延迟队列是指将消息先放入队列中，但是并不立即消费该消息，而是在一定时间后再进行消费的队列。延迟队列可以用来解决某些需要经过一段时间才能处理的任务，例如超时未支付订单的关闭、定时发送消息等场景。

overfit同步小助手 2023-08-19 22:04:23 0 收藏

【Hive】grouping sets() 函数

1. 语法2. 例子

overfit同步小助手 2023-08-19 19:05:11 0 收藏

Flink Metrics监控 pushgateway搭建

overfit同步小助手 2023-08-19 19:04:33 0 收藏

kafka基本概念及操作

overfit同步小助手 2023-08-19 18:04:17 0 收藏

Hadoop概念学习(无spring集成)

文件资源管理的集群与任务调度的集群在一起称为Hadoop集群逻辑上分离,在物理上可以在一起,不同集群分成了不同的进程完成独立的事MapReduce是计算框架,代码层次上的组件,没有集群说HDFS（Hadoop Distributed File System）是Apache Hadoop生态系统中的一

overfit同步小助手 2023-08-19 16:04:17 0 收藏

大数据实时链路备战 —— 数据双流高保真压测 | 京东云技术团队

大数据时代，越来越多的业务依赖实时数据用于决策，比如促销调整，点击率预估、广告分佣等。为了保障业务的顺利开展，也为了保证整体大数据链路的高可用性，越来越多的0级系统建设双流，以保证日常及大促期间数据流的稳定性

overfit同步小助手 2023-08-19 14:04:34 0 收藏

在Spring Boot微服务集成Kafka客户端(spring-kafka)操作Kafka

记录：457场景：在Spring Boot微服务集成Kafka客户端spring-kafka-2.8.2操作Kafka。使用Spring封装的KafkaTemplate操作Kafka生产者Producer。使用Spring封装的@KafkaListener操作Kafka的消费者Consumer。

overfit同步小助手 2023-08-19 14:04:06 0 收藏

RabbitMQ

原因在于RabbitMQ服务端代码是使用并发式语言erlang编写的，双击.exe文件进行安装，安装完成之后创建一个名为ERLANG_HOME的环境变量，其值指向erlang的安装目录，同时将%ERLANG_HOME%\bin加入到Path中，最后打开命令行，输入erl，如果出现erlang的版本信

overfit同步小助手 2023-08-19 13:05:57 0 收藏

Kafka入门,保姆级教学

producer：发布消息的对象称之为主题生产者（Kafka topic producer）topic：Kafka将消息分门别类，每一类的消息称之为一个主题（Topic）consumer：订阅消息并处理发布的消息的对象称之为主题消费者（consumers）broker：已发布的消息保存在一组服务器中

overfit同步小助手 2023-08-19 12:03:58 0 收藏

kafka:消费者从指定时间的偏移开始消费(二)

但这个方案需要使用不常用的AdminClient类，而且如果该主题如果是第一次被消费者拉取消息时，因为得不到消费者的消费偏移，最后的结果，就是从0偏移开始拉取所有消息。并不能真正实现忽略上线之前所有消息的目的。为了忽略忽略掉上线之前的所有消息，从获取指定主题的所有消费者的消费偏移并计算出最大偏移来解

overfit同步小助手 2023-08-19 09:04:31 0 收藏

大数据Flink（六十）：Flink 数据流和分层 API介绍

因此，Flink 是一个用于在无界和有界数据流上进行有状态计算的通用的处理框架，它既具有处理无界流的复杂功能，也具有专门的运算符来高效地处理有界流。由 Flink 应用程序产生的结果流可以发送到各种各样的系统，并且可以通过 REST API 访问 Flink 中包含的状态。在 Flink 中，认为所

overfit同步小助手 2023-08-19 08:05:10 0 收藏