大数据 - overfit.cn

【Flink实战】Flink 商品销量统计-实战Bahir Connetor实战存储数据到Redis6.X

Redis环境说明 redis6使用docker部署redis6.x 看个人主页docker相关文章编码实战数据源static {list.add("spring boot2.x课程");list.add("微服务SpringCloud课程");list.add("RabbitMQ消息队列");l

overfit同步小助手 2023-11-10 05:03:24 0 收藏

使用Flume-KafkaSource实时采集Avro格式数据

在上面的配置文件中，我们定义了一个名为source1的KafkaSource，它会从指定的Kafka主题（your_topic）中消费Avro格式的数据。在启动Flume Agent后，它将开始从Kafka中消费Avro格式的数据，并将其传输到Sink（这里使用的是logger Sink）进行日志输

overfit同步小助手 2023-11-10 03:03:45 0 收藏

如何完全卸载RabbitMQ？

5.删除C:\Windows\System32\config\systemprofile\.erlang.exe文件。6.删除C:\Users\[UserName]\.erlang.exe文件([UserName是你的用户名]）。7.删除C:\Users\[UserName]\AppData\Roa

overfit同步小助手 2023-11-10 01:03:39 0 收藏

hadoop：配置环境变量时，hadoop:command not found解决方法

当我们配置好hadoop的环境变量，更新环境变量后，验证hadoop是否安装成功时，显示hadoop:command not found，如下图。然后用 source /etc/profile 更新环境变量，再用 hadoop version 验证是否安装成功，可以看见安装成功了。我们可以重新打开我

overfit同步小助手 2023-11-10 01:03:36 0 收藏

kafka 如何保证消息的顺序消费

在分布式消费者的情况下，要确保每个分区只由一个消费者消费，这可以通过控制分区数和消费者数的关系来实现。如果您有多个消费者，您可以将分区数设置为消费者的数量，或者通过手动分配分区给每个消费者来确保分区和消费者的一一对应关系。这可以通过生产者的分区策略来实现。默认情况下，Kafka会使用基于消息键（ke

overfit同步小助手 2023-11-10 00:03:13 0 收藏

泛微OA的介绍以及实施计划

1.需求分析阶段：在这个阶段，企业需要明确自身的目标和需求，了解泛微OA平台的功能和技术特点，确定泛微OA平台在企业中的具体应用场景和功能，同时对现有IT基础设施进行评估，确定是否需要进行升级或改造。5.运维升级阶段：在上线之后，需要对泛微OA平台进行日常运维和升级，保证系统的正常运行和持续优化，同

overfit同步小助手 2023-11-09 22:03:27 0 收藏

Spark-3.2.4 高可用集群安装部署详细图文教程

overfit同步小助手 2023-11-09 21:03:44 0 收藏

【Hive SQL 每日一题】环比增长率、环比增长率、复合增长率

它用于比较同一时间段内的两个不同年份的数据变化情况，判断增长趋势和比较不同年度的表现。复合增长率是指在一段连续的时间内，某项指标每个月或年平均增长的复合增长率。环比增长率是指两个相邻时段之间某种指标的增长率。通常来说，环比增长率是比较两个连续时间段内某项数据的增长量大小的百分比。理解环比增长率、同比

overfit同步小助手 2023-11-09 20:03:43 0 收藏

军用大数据 - 结构化数据分析与处理

overfit同步小助手 2023-11-09 20:03:20 0 收藏

Rabbitmq----分布式场景下的应用

每个RabbitTemplate只能配置一个（消息回调）ReturnCallback: 处理消息是否被正确路由到队列，通常在消息无法被路由时触发。: 处理消息是否成功发送到Broker，无论消息是否被正确路由到队列。它是消息成功投递到Broker的确认机制。可以在发送消息时指定，因为每个业务处理co

overfit同步小助手 2023-11-09 18:03:45 0 收藏

【基础篇】四、本地部署Flink

独立部署就是独立运行，即Flink自己管理Flink资源，不依靠任何外部的资源管理平台，比如K8S或者Hadoop的Yarn，当然，独立部署的代价就是：如果资源不足，或者出现故障，没有自动扩展或重分配资源的保证，必须手动处理，生产环境或者作业量大的场景下不建议采用独立部署。应用模式与单作业模式，都是

overfit同步小助手 2023-11-09 18:03:35 0 收藏

大数据集群迁移整理

（3）借助公司大数据团队提供的binlog解析采集工具，如基于开源的canal binlog parser模块二次开发的binlog接入工具，通过MySQL主从复制协议去业务db捕获增量变更数据（模拟MySQL slave，通过socket连接去拉取和解析数据，对于MySQL的性能损耗很小，按照My

overfit同步小助手 2023-11-09 16:03:24 0 收藏

Flink-SQL 写入PostgreSQL 问题汇总

。

overfit同步小助手 2023-11-09 08:03:54 0 收藏

大数据毕业设计选题推荐-热门旅游景点数据分析-Hadoop-Spark-Hive

随着现代科技的发展和人们生活水平的提高，旅游已经变成了一种日常的休闲方式。同时，大数据技术的出现为旅游行业提供了机遇。通过收集和分析海量的数据，我们能够更深入地理解游客的行为和需求，进一步优化旅游服务，提高游客满意度。因此，基于大数据的热门旅游景点数据分析成为了当前研究的热点问题。本课题旨在通过对旅

overfit同步小助手 2023-11-09 06:03:25 0 收藏

Kafka KRaft模式探索

Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。其核心组件包含Producer、Broker、Consumer，以及依赖的Zookeeper集群。其中Zookeeper集群是Kafka用来负责集群元数据的管理、控制器的选举等。

overfit同步小助手 2023-11-09 01:03:46 0 收藏

hive如何建表、并导入数据，导入的csv文件中数据带有逗号的解决方法

使用Hive进行数据存储分析过程中，我们需要建表，导入数据等等相关问题。会经常碰到需要上传CSV文件格式的数据。使用OpenCSVSerde完美解决hive导入CSV文件的相关问题

overfit同步小助手 2023-11-08 23:03:49 0 收藏

Hive中生成自增序列的常用方法

在日常业务开发过程中，通常遇到需要hive数据表中生成一列唯一ID，当然连续递增的更好。最近在结算业务中，需要在hive表中生成一列连续且唯一的账单ID，于是就了解生成唯一ID的方法

overfit同步小助手 2023-11-08 23:03:30 0 收藏

eureka迁移到nacos--双服务中心注册

服务注册中心的迁移有多种方式，官网使用nacos sync，还有民间开发的双注册中心组件eureka-nacos-proxy，但是我用了不太顺利，所以用的是阿里巴巴的双注册中心组件edas-sc-migration-starter。如果要用open feign，需要在启动类排除ribbon自动配置，

overfit同步小助手 2023-11-08 20:03:21 0 收藏

HIVE SQL实现分组字符串拼接concat

3.如果在分组拼接的时候需要保持拼接结果为有序排序，可以通过以下两种方式。1.concat_ws+collect_list 非去重拼接。2.concat_ws+collect_set 去重拼接。函数实现分组字符串拼接，在HIVE SQL中可以使用。2）sort_array（）函数升序排列。在Mysq

overfit同步小助手 2023-11-08 19:03:51 0 收藏

【RabbitMQ】RabbitMQ 消息的可靠性 —— 生产者和消费者消息的确认，消息的持久化以及消费失败的重试机制

在现代分布式应用程序中，消息队列扮演了至关重要的角色，允许系统中的各个组件之间进行异步通信。这种通信模式提供了高度的灵活性和可伸缩性，但也引入了一系列的挑战，其中最重要的之一是消息的可靠性。首先让我们来了解一下，在消息队列中，消息从生产者发送到交换机，再到队列，最后到消费者，有哪些情况会导致消息的丢

overfit同步小助手 2023-11-08 17:03:48 0 收藏