消息队列(基于Kafka)八股复习/面试提词器

消息队列八股提词器更新,三大件完结!

【大数据】深入了解Hadoop

hdfs的元数据两个部分内存上的元数据在服务运行期间,所有的元数据会先存储在内存上文件信息,datanode信息,块信息元数据文件为了避免内存上的元数据丢失,会将内存的上的元数据保存在磁盘上secondarynamenode完成元数据文件的保存存储位置在hadoop的指定数据edits_xxxxx

Gelly Streaming 实战指南:基于Apache Flink的图流处理

Gelly Streaming 实战指南:基于Apache Flink的图流处理 gelly-streaming An experimental Graph Streaming API for Apache Flink

大数据Flink(一百二十一):Flink CDC基本介绍

Flink CDC 基于数据库日志的 Change Data Caputre 技术,实现了全量和增量的一体化读取能力,并借助 Flink 优秀的管道能力和丰富的上下游生态,支持捕获多种数据库的变更,并将这些变更实时同步到下游存储。目前,Flink CDC 的上游已经支持了 MySQL、MariaDB

spark-scala使用与安装(一)

Scala是一门多范式的编程语言,一种类似java的编程语言,设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台(Java虚拟机),并兼容现有的Java程序。

Spark Streaming in Python 项目教程

Spark Streaming in Python 项目教程 Spark-Streaming-In-PythonApache Spark 3 - Structured Streaming Course Material项目地址:https://gitcode.com/gh_mirrors/sp/Sp

Flink cdc 实现源表sqlserver到目标表sqlserver或者mysql

源表到目标表的同步

大数据-137 - ClickHouse 集群 表引擎详解2 - MergeTree 存储结构 一级索引 跳数索引

ClickHouse的稀疏索引与Kafka的稀疏索引不同,可以由用户自由组合多列,因此也要格外注意不要加入太多索引列,防止索引数据过于稀疏,增大存储和查找成本。MergeTree 的分区目录在数据写入过程中被创建,不同的批次写入数据属于同一分区,也会生成不同的目录,在之后某个时刻再合并(写入后10-

【kafka】基本概念

kafka基本概念:包括主题、分区、副本、以及详细介绍副本机制

大数据新视界 --大数据大厂之 Vue.js 与大数据可视化:打造惊艳的数据界面

本文深入探讨 Vue.js 在大数据可视化中的应用。介绍了其优势,如数据驱动视图更新和组件化开发,以及与 Echarts、D3.js、Highcharts、Leaflet 等可视化工具结合。还阐述了性能优化策略,包括懒加载数据、虚拟滚动、代码分割和缓存策略。通过医疗、交通、教育、环保等实际案例分析,

docker-compose基础开发环境搭建(mysql、redis、minio、kafka)

datadir=/var/lib/mysql#bind-address=127.0.0.1expire_logs_days=7init_connect=‘SET NAMES utf8mb4’lower_case_table_names=1#sql_mode=STRICT_TRANS_TABLES,N

毕业设计 大数据招聘数据可视化系统(源码+论文)

🔥这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天要分享的是🚩毕业设计 大数据招聘数据可视化系统(源码+论

Centos安装RabbitMQ

【代码】Centos安装RabbitMQ。

Winton Kafka Streams 使用指南

Winton Kafka Streams 使用指南 winton-kafka-streams A Python implementation of Apache Kafka Streams

PHP使用rabbitMQ

RabbitMQ 是一个强大且灵活的消息队列系统,结合 PHP 可以实现很多高级应用场景,如异步任务、任务重试、负载均衡等。在高并发和分布式系统中,RabbitMQ 可以有效提高系统的可扩展性和稳定性。

毕设成品 大数据电影数据分析与可视化系统

今天学长向大家介绍一个机器视觉的毕设项目🚩基于大数据的电影数据分析与可视化系统毕业设计 大数据电影评论情感分析🧿 项目分享:见文末!🧿 项目分享:见文末!

RabbitMQ消息队列

虚拟主机类似于Apache的虚拟主机,如果没有虚拟主机,当RabbitMQ中的数据越来越庞大,队列越来越多,随之而来的是令人头痛的管理问题,比如队列、交换器命名冲突,它们相互影响等等。虚拟主机提供了资源的逻辑分组和分隔,每一个虚拟主机本质上是mini版的RabbitMQ服务器,他们有用自己的连接、队

大数据Flink(一百二十三):五分钟上手Flink MySQL连接器

由于商品名称及商品价格数据存储在另一张维度表 dimension_table中,我们需要将结果视图和 dimension_table进行JOIN操作,并将「商品销售量」、「商品价格」相乘计算出「商品销售额」,并提取结果中的商品可读名称信息作为结果表。本场景将以阿里云实时计算Flink版为基础,使用F

大数据技术进阶-spark的分布式join策略选择(附实例)

不论是shuffle join还是broadcast join,一旦数据分发完毕,理论上可以采用HJ、SMJ、NLJ这3种实现机制中的任意一种,完成Executors内部的数据关联。因此,两种分发模式,与三种实现机制,组合起来,共有6种分布式join策略。对于等值关联,spark sql优先考虑采用

Hive/Spark小文件解决方案(企业级实战)–参数和SQL优化

Spark读取Hive数据或文件如何提升速度的优化思路

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈