大数据 - overfit.cn

MySQL与Hadoop集成：实现大数据分析

1.背景介绍在大数据时代，数据的处理和分析已经成为企业和组织中非常重要的一部分。MySQL和Hadoop是两个非常受欢迎的数据处理和分析工具。MySQL是一种关系型数据库管理系统，用于存储和管理结构化数据。Hadoop是一个开源的分布式文件系统和数据处理框架，用于处理和分析非结构化数据。在本文中，我

overfit同步小助手 2024-06-21 06:03:16 0 收藏

Kafka的云原生应用与微服务架构

Kafka的云原生应用与微服务架构1.背景介绍在现代软件开发中，云原生应用和微服务架构已经成为主流趋势。云原生应用利用云计算的优势，实现了高可用性、弹性扩展和快速部署。而微服务架构则通过将应用拆分为多个独立的服务，提升了系统的灵活性和可维护性。在这一背景下，Apache Kafka作为

overfit同步小助手 2024-06-21 05:03:21 0 收藏

从零搭建开发脚手架 Spring Boot集成Kafka实现生产者消费者的多种方式

我们使用。和的代码：@Bean@Bean我们可以使用这个新的来发送Greeting消息：同样，让我们修改和以正确反序列化 Greeting 消息：@Bean// …@Beanspring-kafka JSON 序列化器和反序列化器使用Jackson库，它也是 spring-kafka 项目的可选 M

overfit同步小助手 2024-06-21 04:03:55 0 收藏

【大数据存储】实验3 HBase的安装和基本操作

1、创建一个表student，该表包含两个列族Sinfo和Course，其中Sinfo包含。5、为student表增加“STel”列族，添加每位同学的联系方式（电话列和邮。关系型数据库（比如MySQL）中，需要首先创建数据库，然后再创建表，但。是，在HBase数据库中，不需要创建数据库，只要直接创建

overfit同步小助手 2024-06-21 04:03:45 0 收藏

分布式锁的3种实现（数据库、缓存、Zookeeper)

搞定算法，面试字节再不怕，有需要文章中分享的这些二叉树、链表、字符串、栈和队列等等各大面试高频知识点及解析最后再分享一份终极手撕架构的大礼包(学习笔记)：分布式+微服务+开源框架+性能优化笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新**如果你觉得这些内容对你有帮助，可以添加V获取：vip1

overfit同步小助手 2024-06-21 03:03:53 0 收藏

win setup kafka 3.6.2 Step-by-Step Guide

【代码】win setup kafka 3.6.2 Step-by-Step Guide。

overfit同步小助手 2024-06-21 02:03:52 0 收藏

HBase与Flink集成：HBase与Flink集成与流处理

1.背景介绍HBase与Flink集成是一种非常有用的技术，它可以帮助我们更有效地处理大量数据。在本文中，我们将深入了解HBase与Flink集成的背景、核心概念、算法原理、最佳实践、实际应用场景、工具和资源推荐以及未来发展趋势与挑战。1. 背景介绍HBase是一个分布式、可扩展、高性能的列式存储系

overfit同步小助手 2024-06-21 00:03:52 0 收藏

hadoop完全分布式搭建

提示:hadoop完全分布式的搭建与伪分布式搭建的准备工作是非常相似的,如果不会不会伪分布式搭建,可以去看看我发布的hadoop伪分布式搭建.注意:前面有 # 的代表注解,可以不写。

overfit同步小助手 2024-06-20 23:03:32 0 收藏

修改 Zookeeper 的客户端连接端口（默认2181端口）

修改 zookeeper 的客户端连接端口

overfit同步小助手 2024-06-20 22:03:40 0 收藏

Kafka与RocketMQ区别是什么

本文详细对比分析了Kafka和RocketMQ在适用场景、架构设计、性能、可靠性、实时性、延迟消息和适用项目等方面的差异。总体来说，Kafka和RocketMQ都是优秀的消息队列系统，适用于不同的业务场景。在选择时需要根据实际需求进行评估和选择。如果需要处理大规模日志数据或实时数据流，可以选择Kaf

overfit同步小助手 2024-06-20 21:03:57 0 收藏

Kafka内外网分流配置listeners和advertised.listeners

Kafka部署在内网，内网Java服务会使用Kafka收发消息，另外，Java服务会与其他第三方系统使用kafka实现数据同步，也就是外网也会发送消息到kafka，外网IP做了端口映射到了内网，Kafka 服务器对外宣传的端点信息，它会将地址注册到Zookeeper中，用于告诉客户端应该连接到哪个地

overfit同步小助手 2024-06-20 21:03:47 0 收藏

【AI大数据计算原理与代码实例讲解】Spark Streaming

作者：禅与计算机程序设计艺术Artificial IntelligenceDS: Data ScienceHDFS: Hadoop Distributed File SystemRDD: Resilient Distributed Dataset 背景介绍随着互联网的快速发展以及各类传

overfit同步小助手 2024-06-20 19:03:32 0 收藏

Hadoop笔记

1.hadoop环境搭建，linux命令（vi);2.分布式的基本概念，cap理论（遵循此原则开发分布式数据库），hdfs,mapreduce；3.3.1；3.2重点；4.map，reduce过程，优缺点（第一二个版本）；6.6.3；7.sqoop；8.Zookeeper，yarn，mapreduc

overfit同步小助手 2024-06-20 18:03:14 0 收藏

flink cdc，standalone模式下,任务运行一段时间taskmanager挂掉

这个配置的含义是,超时(以毫秒为单位)，在此之后任务取消超时并导致致命的 TaskManager 错误。

overfit同步小助手 2024-06-20 16:03:22 0 收藏

头歌 Flink Transformation（数据转换入门篇）

17,女,2016-02-21 20:21:17 ---> 用户ID，用户性别，该用户在平台注册账号的时间戳。* 需求：使用flatMap、groupBy、sum 等算子完成单词统计。// 使用flatMap将每行字符串拆分成单词并转换成元组。// 过滤出注册年份在2015年之后的数据。// 使用g

overfit同步小助手 2024-06-20 15:03:52 0 收藏

ClickHouse 集群部署（不需要 Zookeeper）

使用 ClickHouse Keeper 安装部署 ClickHouse 集群，并使用 MergeTree、ReplicatedMergeTree 两种表引擎的分布式表，分别实现数据自动分片和副本数据自动同步。

overfit同步小助手 2024-06-20 15:03:41 0 收藏

spark实验求TOP值

已知存在两个文本文件，file1.txt和file2.txt，内容分别如下：file1.txtfile2.txt以上两个文件所存储的数据字段的意义为：orderid, userid, payment, productid。

overfit同步小助手 2024-06-20 14:03:54 0 收藏

kerberos-hive-dbeaver问题总结

hive kerberos 认证与连接问题

overfit同步小助手 2024-06-20 14:03:45 0 收藏

消息队列选型（RabbitMq、RocketMq、Kafaka）

当引入消息队列时，常见的选择包括ActiveMQ、Kafka、RabbitMQ和RocketMQ。然而，近年来，ActiveMQ的活跃度已经下降，很多公司已经不再使用这款消息队列中间件，因此在比较中不再涉及该产品。其实如果一般来说你业务使用mq，对消息的安全性要求较高，选择RocketMq；如果对于

overfit同步小助手 2024-06-20 14:03:22 0 收藏

rabbitmq延时队列相关配置

在设置延时队列时，你需要使用 x-delayed-type 参数来指定该交换机的类型为 x-delayed-message，并使用 x-delayed-message 的头部属性 x-delay 来指定消息的延迟时间。消息将立即被路由到匹配的队列，没有任何延迟。使用 x-delayed-messag

overfit同步小助手 2024-06-20 13:03:43 0 收藏