Spark 作业执行流程

Spark 作业执行流程

Kafka bootstrap.servers

Kafka bootstrap.servers

kafka 报错 - Cannot assign requested address

因为如果是 kafka 集群,你可以选择只给客户端配置一个 kafka 节点的地址(这样是不推荐的),但是客户端必须要访问集群中的每一个节点,所以必须通过这个节点获得集群中每一个节点的访问地址。而且有的环境可能被配置成这些 kafka 宿主机是没有外网访问权限的,即虽然他可以访问自己的外网ip,但是

nacos和eureka的区别

Nacos是一个功能全面的服务注册与发现组件,它提供了服务注册、发现、配置管理和动态 DNS 等功能。除了服务注册与发现,Nacos还提供了配置中心和命名空间管理等功能,使得它成为一个全方位的微服务基础设施组件。: Nacos支持多种服务发现协议,包括基于DNS的服务发现和基于HTTP/REST的服

filebeat->kafka>elk日志采集

/可以防止日志爆盘,将所有标准输出及标准错误输出到/dev/null空设备,即没有任何输出信息。//启动logstash --path.data 指定数据存储路径。查看消费者consumer的group列表。查看kafka中指定topic的详情。查看指定的group。

docker部署rabbitmq

我部署的是3.8版本的。

ZooKeeper

ZooKeeper入门

基于python淘宝商品数据爬虫分析可视化系统 网络爬虫+Flask框架+MySQL数据库 大数据 毕业设计

基于python淘宝商品数据爬虫分析可视化系统 网络爬虫+Flask框架+MySQL数据库 大数据 毕业设计

【2023 年第二届钉钉杯大学生大数据挑战赛初赛】 初赛 A:智能手机用户监测数据分析 问题一Python代码分析

2023 年第二届钉钉杯大学生大数据挑战赛初赛题目 初赛 A:智能手机用户监测数据分析一、问题背景近年来,随着智能手机的产生,发展到爆炸式的普及增长,不仅推动了中 国智能手机市场的发展和扩大,还快速的促进手机软件的开发。近年中国智能手 机市场品牌竞争进一步加剧,中国超越美国成为全球第一大智能手机市场

第六章 rabbitmq高可用集群

在服务之间会采用mq进行消息通信,而rabbitmq本身也如同consul一样,如果只有一个节点那么就可能出现宕机的问题,并且基于mq的特点我们是可以在多个服务之间使用同一个mq来相互通信,因此高可用的架构设计就必不可少。

ES数据迁移

ES数据迁移

RabbitMQ学习(五):RabbitMQ持久化

在最开始的时候我们学习到 RabbitMQ 分发消息采用的轮训分发,但是在某种场景下这种策略并不是很好,比方说有两个消费者在处理任务,其中有个消费者 1 处理任务的速度非常快,而另外一个消费者 2处理速度却很慢,这个时候我们还是采用轮训分发的话就会到这处理速度快的这个消费者很大一部分时间处于空闲状态

kafka使用详解、最佳实践和问题排查

kafka常用概念、与RabbitMQ对比、最佳实践、工具推荐、Spring快速使用和问题排查

利用t-SNE可视化自己的数据集分布

Python下利用t-SNE可视化自己的数据集

【云原生|Docker系列第3篇】Docker镜像的入门实践

在本篇博客中,我们深入探讨了Docker镜像的概念。我们学习了如何获取和管理Docker镜像,包括拉取镜像、构建自定义镜像以及导出和导入镜像。我们还介绍了如何通过Dockerfile制作镜像以及Dockerfile的指令。最后,我们了解了如何分享和推送Docker镜像,以便与他人共享和合作。通过学习

Flink 学习十 FlinkSQL

flinksql 从入门到入门...

美团买菜基于 Flink 的实时数仓建设

美团买菜实时数仓技术负责人严书,在 Flink Forward Asia 2022 实时湖仓专场的分享。

消息队列选型——为什么选择RabbitMQ

MQ消息是目前分布式系统必不可少的组件,但是面对市面上众多的MQ组件,我们该用什么呢?我以实际项目的需求触发,介绍今天的主角——rabbitMQ。同时也会告知又有哪些优势和不足。事不宜迟,就开始今天的学习吧

ETL还是ELT:企业如何选择构建数据仓库的最佳工具?

ETL工具通常基于预定义的数据模型进行数据转换,这些模型包括维度、事实表等。这样ETL过程更加标准化和可重复,减少了构建数据仓库的复杂性。

如何基于 Apache Doris 与 Apache Flink 快速构建极速易用的实时数仓

随着大数据应用的不断深入,企业不再满足离线数据加工计算的时效,实时数据需求已成为数据应用新常态。伴随着实时分析需求的不断膨胀,传统的数据架构面临的成本高、实时性无法保证、组件繁冗、运维难度高等问题日益凸显。为了适应业务快速迭代的特点,帮助企业提升数据生产和应用的时效性、进一步挖掘实时数据价值,实时数

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈