大数据 - overfit.cn

Kafka核心原理第一弹——更新中

kafka的通信主要发生于生产端和broker之间，broker和消费端之间，broker和broker之间，这些通信都是基于TCP协议进行的，大家自己看看网络课程，底层基于TCP连接和传输数据，应用层的协议，是Kafka自己自定义的所谓自定义协议，就是定好传输数据的格式，请求格式、响应格式，这样大

overfit同步小助手 2023-10-09 01:03:59 0 收藏

FlinkSQL kafka完整案例可直接复制使用

完整案例，可以直接使用。flinksql 消费kafka整体来说是十分简单好用的，使用时门口较低，实时性又高

overfit同步小助手 2023-10-09 01:03:44 0 收藏

Hive 中 sort by 和 order by 的区别

在 Hive 中，SORT BY和ORDER BY都用于对查询结果进行排序，但它们在实现方式和适用场景上有一些区别。

overfit同步小助手 2023-10-08 22:04:07 0 收藏

flink CDC-SqlServerCDC 开启代理及SQL Server开启CDC的完整操作过程

flink CDC SqlServer CDC

overfit同步小助手 2023-10-08 22:03:43 0 收藏

zookeeper 理论合集

用于管理分布式系统，使一个系统中的节点知道其他节点的状态。实现方式？通过维护和监控存储的数据变化，达到基于数据的集群一致性管理。简单说，zookeeper = 文件系统 + 监控通知机制配置维护、域名维护、分布式同步、服务发现等C：保证「，并不保证强一致性，在十几秒可以Sync到各个节点（如果保证强

overfit同步小助手 2023-10-08 21:04:02 0 收藏

【HDFS】每天一个RPC系列----complete（二）：客户端侧

overfit同步小助手 2023-10-08 21:03:32 0 收藏

2023_Spark_实验九：Scala函数式编程部分演示

Scala，基于idea开发wordcout。

overfit同步小助手 2023-10-08 20:03:40 0 收藏

大数据之使用Flume监听端口采集数据流到Kafka

本题来源于全国职业技能大赛之大数据技术赛项电商赛题 - 实时数据采集题目很简单。大数据处理涉及到海量的数据采集和处理，如何高效地采集数据是一个重要的问题。Flume是一个分布式的、可靠的、高可用的海量日志采集工具，可以轻松地采集、聚合和移动大量的数据。在数据采集过程中，Flume可以使用网络协议、文

overfit同步小助手 2023-10-08 20:03:29 0 收藏

Flink、Yarn架构，以Flink on Yarn部署原理详解

overfit同步小助手 2023-10-08 20:03:22 0 收藏

RabbitMQ源码分析之日志系统

RabbitMQ是一个开源的消息队列系统，本文将从RabbitMQ服务器日志系统的设计和实现中，对其进行深入剖析。RabbitMQ服务器基于Erlang开发而成，具有高吞吐量、低延迟等优点。同时，它支持多种消息中间件协议，如AMQP、MQTT、STOMP等。本文不讨论RocketMQ消息中间件协议，

overfit同步小助手 2023-10-08 19:04:02 0 收藏

Hbase 系列教程：HBase 搭建高可用集群

作者：禅与计算机程序设计艺术 1.简介Apache HBase 是 Apache 基金会开源项目之一，是一个分布式 NoSQL 数据库。它是一个可扩展的、面向列的、存储在 Hadoop 文件系统（HDFS）上的结构化数据存储。它支持 Hadoop 的 MapRe

overfit同步小助手 2023-10-08 19:03:33 0 收藏

泰迪大数据实训平台产品介绍

大数据实训管理平台、大数据开发实训平台、大数据编程实训平台

overfit同步小助手 2023-10-08 17:03:36 0 收藏

kafka晋升之路-理论+场景

本文讲解了kafka的基本概念、常见问题、通过此篇文章，相信你对kafka已经有了一定的了解，赶紧实验起来吧。

overfit同步小助手 2023-10-08 14:03:46 0 收藏

RabbitMQ的使用

1、大多应用中，可通过消息服务中间件来提升系统异步通信、扩展解耦能力消息代理（message broker）和目的地当消息发送者发送消息以后，将由消息代理接管，消息代理保证消息传递到指定目的地。3、消息队列主要有两种形式的目的地队列（queue）：点对点消息通信（point-to-point）主题（

overfit同步小助手 2023-10-08 14:03:28 0 收藏

科普rabbitmq，rocketmq，kafka三者的架构比较

拉取消息：RocketMQ 的消费者（Consumer）通过订阅 Topic 和指定消费者组（Consumer Group）来拉取消息。发送消息：RocketMQ 的生产者（Producer）将消息发送到指定的 Topic，并不能直接选择要发送到的队列，而是由 Broker 负责将消息分发到相应的队

overfit同步小助手 2023-10-08 13:03:22 0 收藏

处理el-table大数据卡顿的问题，包含tree型数据格式

有时候el-table的数据可能有成千上万条，而且又要在一页显示完，这时候页面渲染的dom太多了，可能会造成页面卡顿。因为数据量过多导致浏览器渲染过多的标签元素导致DOM树占用内存较大使得用户操作阻塞。具体原理可参考别的大佬写的文章：DOM性能瓶颈与Javascript性能优化.使用第三方插件

overfit同步小助手 2023-10-08 11:03:59 0 收藏

Spark SQL

Spark SQL属于Spark计算框架的一部分，是专门负责结构化数据的处理计算框架，Spark SQL提供了两种数据抽象：DataFrame、Dataset,都是基于RDD之上的一种高级数据抽象，在RDD基础之上增加了一个schema表结构。DataFrame是以前旧版本的数据抽象（untyped

overfit同步小助手 2023-10-08 06:03:42 0 收藏

配置开启Hive远程连接

使用IDEA工具远程连接Hive，首先需要配置开启Hive远程连接支持，主要有2种方式来配置开启Hive远程连接。

overfit同步小助手 2023-10-08 05:03:17 0 收藏

Hadoop 集群规划与部署最佳实践

2009年2月2日，Apache Hadoop项目诞生。它是一个开源的分布式系统基础架构，用于存储、处理和分析海量的数据。Hadoop具有高容错性、可靠性、可扩展性、适应性等特征，因而广泛应用于数据仓库、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。由于Hadoop采用“分而治之”的架构设计理念

overfit同步小助手 2023-10-08 04:04:04 0 收藏

基于Hadoop的学生校园网行为分析

🙌😂oi退役选手，Java、大数据、单片机、IoT均有所涉猎，热爱技术，技术无罪获取源码，添加WX。

overfit同步小助手 2023-10-08 04:03:57 0 收藏