大数据 - overfit.cn

2024.1.11 Kafka 消息队列,shell命令,核心原理

同时，Kafka还支持对消息进行压缩，减小了消息的存储空间，降低了网络传输的开销，进一步提高了读写性能。它通过直接内存访问（DMA）技术，将数据从磁盘读取到内存或者从内存写入到磁盘，避免了数据的多次复制，减少了IO操作的开销，提高了读写性能。它将数据分成多个分区，并将这些分区分布在不同的节点上，实现

overfit同步小助手 2024-02-09 22:03:32 0 收藏

大数据-kafka学习笔记

Kafka 是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。

overfit同步小助手 2024-02-09 21:03:42 0 收藏

HBase的数据库容量规划与优化

1.背景介绍HBase的数据库容量规划与优化1. 背景介绍HBase是一个分布式、可扩展、高性能的列式存储系统，基于Google的Bigtable设计。它是Hadoop生态系统的一部分，可以与HDFS、MapReduce、ZooKeeper等组件集成。HBase适用于大规模数据存储和实时数据访问场景

overfit同步小助手 2024-02-09 21:03:39 0 收藏

Hive Case When与IF的用法（嵌套、混合使用）

Hive Case When与IF的用法（嵌套、混合使用）——case when与if语句使用详解

overfit同步小助手 2024-02-09 21:03:27 0 收藏

Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive

Hadoop 是一个开源的分布式计算平台，其中包含了一个分布式文件系统 HDFS。在 HDFS 中，NameNode 和 DataNode 是两个重要的组件。NameNode 是 HDFS 的主服务器，负责管理文件系统的命名空间和客户端对文件的访问。DataNode 是存储实际数据块的服务器，负责存

overfit同步小助手 2024-02-09 20:03:44 0 收藏

Zookeeper安全性考虑：防范潜在的安全风险

1.背景介绍在分布式系统中，Zookeeper是一个非常重要的组件，它提供了一种可靠的、高性能的协调服务。然而，在实际应用中，Zookeeper也面临着一系列的安全风险。为了确保Zookeeper的安全性，我们需要深入了解其中潜在的安全风险，并采取相应的防范措施。1. 背景介绍Zookeeper是一

overfit同步小助手 2024-02-09 18:03:43 0 收藏

spring boot 使用 Kafka

高吞吐量：Kafka能够处理大规模的数据流，并支持高吞吐量的消息传输。持久性：Kafka将消息持久化到磁盘上，保证了消息不会因为系统故障而丢失。分布式：Kafka是一个分布式系统，可以在多个节点上运行，具有良好的可扩展性和容错性。支持多种协议：Kafka支持多种协议，如TCP、HTTP、UDP等，可

overfit同步小助手 2024-02-09 17:03:53 0 收藏

flink on yarn集群部署模式

介绍YARN 上部署的过程是：客户端把 Flink 应用提交给 Yarn 的ResourceManager, Yarn 的 ResourceManager 会向 Yarn 的 NodeManager 申请容器。在这些容器上，Flink 会部署JobManager 和 TaskManager 的实例，

overfit同步小助手 2024-02-09 17:03:35 0 收藏

Kafka3.0源码学习

Sender 对象被放到了一个线程中启动，所有需要点击 newSender()方法中的 Sender，并找到 sender 对象中的 run()方法。生产者 sender 线程初始化，KafkaProducer.java中点击 newSender()方法，查看发送线程初始化。生产者 main 线程初

overfit同步小助手 2024-02-09 17:03:22 0 收藏

【SpringBoot框架篇】35.kafka环境搭建和收发消息

搭建kafka环境,在springboot中使用kafka创建主题、生产消息和消费消息

overfit同步小助手 2024-02-09 17:03:17 0 收藏

北大经院工作坊第166场 | 学术论文与量化研究实践（计量、金融和大数据工作坊）-原人民大学教授童庆

童庆，原中国人民大学商学院教授, 博士生导师，目前从事量化基金投资。复旦大学计算数学本科, 美国埃默里大学金融博士, CFA持有者。

overfit同步小助手 2024-02-09 16:03:27 0 收藏

python毕设选题 - 机器学习股票大数据量化分析与预测系统 - python 毕业设计

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩机器学习股票大数据量化分析与预测系统🥇学

overfit同步小助手 2024-02-09 16:03:21 0 收藏

Message Queue --- RabbitMQ

MQ全称是Message Queue，消息的队列，因为是队列，所以遵循FIFO 先进先出的原则，它是一种跨进程的通信机制，用于上下游传递消息。在互联网架构中，MQ是一种非常常见的上下游“逻辑解耦+物理解耦”的消息通信服务。

overfit同步小助手 2024-02-09 15:03:15 0 收藏

Eureka：集群环境配置

这样在三个集群上面也能访问这些服务，若有一个节点崩了，可以切换一下端口号，用另一个节点去访问注册的服务。这样可以防止断开链接！互相绑定，一个崩了，不一定全部崩。配置文件yml 改一下端口号。

overfit同步小助手 2024-02-09 13:03:34 0 收藏

Spark SQL的高级用法

需求:请生成一列数据, 内容为 1 , 2 , 3 , 4 ,5。

overfit同步小助手 2024-02-09 13:03:30 0 收藏

SpringBoot3 整合Kafka

官网：https://kafka.apache.org/documentation/

overfit同步小助手 2024-02-09 12:03:52 0 收藏

MQ回顾之rabbitmq速通

MQ回顾之rabbitmq速通，精华回顾

overfit同步小助手 2024-02-09 12:03:39 0 收藏

Eureka整合seata分布式事务

在微服务的大环境下，服务按照业务维度拆分之后会遇到事务不一致问题，Seata的开源填补了两阶段提交这种模式，并且无业务代码的侵入，这里采用eureka集群整合Seata。

overfit同步小助手 2024-02-09 12:03:23 0 收藏

RabbitMQ基础编程模型及详细使用

这些Binding涉及到消息的不同分发逻辑，与Exchange和Queue一样，如果Broker上没有建立绑定关系，那么RabbitMQ会按照客户端的声明，创建这些绑定关系。所以这里要注意，如果消费者一直不对消息进行应答，那么消息就会不断的发起重试，这就会不断的消耗系统资源，最终造成服务宕机。在声明

overfit同步小助手 2024-02-09 11:03:44 0 收藏

一文带你读懂：数据集市、数据仓库、数据湖

数据集市、数据仓库和数据湖都是针对不同类型数据处理需求的解决方案。数据集市关注于特定业务部门和用户需求，提供定制化的数据分析和报告；数据仓库关注于企业级数据整合和分析，提供全局的数据视角；数据湖关注于海量原始数据hello宝子们...我们是艾斯视觉擅长ui设计和前端开发10年+经验！希望我的分享能帮

overfit同步小助手 2024-02-09 11:03:40 0 收藏