大数据 - overfit.cn

Flintrock：Apache Spark 集群管理工具指南

Flintrock：Apache Spark 集群管理工具指南 flintrockA command-line tool for launching Apache Spark clusters.项目地址:https://gitcode.com/gh_mirrors/fl/flintrock 项目介绍

overfit同步小助手 2024-09-06 21:03:12 0 收藏

大数据-113 Flink DataStreamAPI 程序输入源自定义输入源非并行源与并行源

上节研究了Flink的DataStreamAPI，文件、Socket、集合、连接器等内容。本节研究自定义的输入源，包含非并行源与并行源。在 Apache Flink 中，非并行源（Non-Parallel Source）是一种特殊的源操作（Source Operator），它的最大并行度被限制为 1

overfit同步小助手 2024-09-06 20:03:34 0 收藏

kafka学习（三）：生产者

生产者客户端的代码步骤大概有：1）配置生产者客户端参数，创建生产者实例；2）构建待发送的消息；3）消息发送4）关闭生产者实例代码示例：// 1. 配置生产者客户端参数，创建生产者实例// 2. 构建待发送的消息// 3. 消息发送// 4. 关闭生产者实例。

overfit同步小助手 2024-09-06 20:03:20 0 收藏

【问题解决】docker上运行了rabbitmq的容器，但是无法访问web页面

docker上拉取rabbitmq的镜像，然后运行使用这个镜像的容器，启动rabbitmq之后却无法访问对应web页面。改为拉取management版本的镜像之后，还是一样的步骤，就可以登录到rabbitmq页面了。rabbitmq要拉取management版本的。

overfit同步小助手 2024-09-06 17:03:31 0 收藏

Kafka-时间轮和延迟操作-源码流程

DelayedProduce通过DelayedOperationPurgatory.tryCompleteElseWatch()被放入Watchers和SystemTimer中。Watchers的tryCompleteWatched()方法会尝试完成DelayedProduce（调用DelayedP

overfit同步小助手 2024-09-06 16:03:53 0 收藏

Kafka【二】关于消费者组（Consumer Group）、分区（partition）和副本（replica）的理解

Apache Kafka 是一个分布式流处理平台，它允许你发布和订阅记录流，存储记录流，并且可以对这些记录流进行处理。在 Kafka 中，消息被发布到特定的主题（topic），然后由消费者（consumer）订阅并消费这些消息。消费者组（Consumer Group）是 Kafka 中的一个重要概念

overfit同步小助手 2024-09-06 16:03:45 0 收藏

linux centos rabbitmq3.7.5 一键安装部署

在选择消息队列系统时，需要根据具体的业务需求和场景进行权衡和选择。它支持多种编程语言，如Python、Java、Ruby、PHP、C#、JavaScript、Go、Elixir、Objective-C和Swift等，使得不同技术栈之间的通信变得简单高效。综上所述，RabbitMQ作为一个开源的消息代

overfit同步小助手 2024-09-06 16:03:34 0 收藏

zookeeper+kafka消息队列群集部署

▪ 各节点向Zookeeper中注册节点信息，以编号最小算法选举出一个主节点，另外的节点就是备用节点，由Zookeeper完成对两个master进程的调度，和主、备节点的分配和写作。▪ 如果主节点恢复了，它会再次向Zookeeper注册自身的节点信息，但注册的节点信息编号会变小，因此不会再称为mas

overfit同步小助手 2024-09-06 15:03:59 0 收藏

Kettle下载安装

MySql8.0；JDK1.8；Kettle 9.4

overfit同步小助手 2024-09-06 15:03:54 0 收藏

Gather：开启绝密社交和收益双重惊喜之旅

在数字时代，我们的隐私信息面临着严重的泄露风险，保护个人隐私变得尤为重要。基于区块链加专利硬件技术，Gather成为全球唯一实现真正绝密社交的DePIN社交产品，带来了划时代的社交体验。而其硬件产品G-BOX，不仅是你的隐私守护者，还能为你创造收益。Gather 基于Web3.基础设施公链，加上密码

overfit同步小助手 2024-09-06 15:03:39 0 收藏

Day16_Zookeeper

ZAB协议，全称Zookeeper Atomic Broadcast（Zookeeper原子广播协议），是Zookeeper设计的一种支持崩溃恢复和原子广播的协议。集群间通过Zab协议（Zookeeper Atomic Broadcast）来保持数据的一致性；Zab协议包含两个阶段：Zab协议包含两

overfit同步小助手 2024-09-06 15:03:32 0 收藏

南大通用GBase 8s大对象处理：简化大数据插入与管理

更多精彩内容尽在南大通用技术社区，南大通用致力于成为用户最信赖的产品供应商。数据库对大对象（LOB）的处理能力直接影响到数据存储的效率和便捷性。国产数据库GBase 8s系统提供了对和的全面支持。本文将探讨GBase 8s中大对象的存储方式和插入方法，帮助用户更高效地管理大规模文本和二进制数据。

overfit同步小助手 2024-09-06 14:03:52 0 收藏

宝塔面板安装RabbitMQ（已解决）

解决阿里云宝塔面板安装RabbitMQ，无法启动，安装失败,文件不存在:/usr/lib/erlang/bin/epmd

overfit同步小助手 2024-09-06 14:03:37 0 收藏

学习大数据DAY41 Hive 分区表创建

索引（相当于应用“看到”的只是一个表或索引），但在物理上这个表或索引可。分区对应用透明，即对访问数据库的应用而言，逻辑上讲只有一个表或一个。注意：如果删除的分区是表中唯一的分区，那么此分区将不能被删除，要想。4 将第二部的数据使用动态分区的方法导入到第三步的表中。分区是将一个表或索引物理地分解

overfit同步小助手 2024-09-06 14:03:32 0 收藏

北京御龙古今艺术剧院山东分院授牌仪式暨七夕之夜演唱会成功举办

流行声乐导师教授、亚洲艺术节表演嘉宾、中国好声音声乐导师、央视星光大道评委、著名军旅歌手曹华演唱了《懂你》、《我爱中国》；《星光大道》大众评委团团长、《黄金一百秒》评委、邓丽君模仿者张琳琳演唱了《我只在乎你》、《你怎么说》；华语乐坛唱作人、中欧文化大使、中国通俗文艺研究会理事、《公益中国》十大爱国明

overfit同步小助手 2024-09-06 13:03:49 0 收藏

HiveSwarm 使用教程

HiveSwarm 使用教程 HiveSwarmHelpful user defined fuctions / table generating functions for Hive项目地址:https://gitcode.com/gh_mirrors/hi/HiveSwarm 项目介绍HiveSw

overfit同步小助手 2024-09-06 13:03:35 0 收藏

决策模型和符号（DMN）

BPM+ Health 是建立在使用开放的、基于标准的符号的基础上建立的，包括 DMN（决策管理）和其他开放 IT 标准，允许所有类型的卫生组织、专业协会和供应商记录他们的护理路径和工作流程，以便它们是可共享、可发现和可自动化的。目前国内DMN的应用还在起步阶段，BRMS决策引擎/规则引擎基本以后端

overfit同步小助手 2024-09-06 13:03:25 0 收藏

探索找寻火花：简化你的PySpark之旅

探索找寻火花：简化你的PySpark之旅 findspark项目地址:https://gitcode.com/gh_mirrors/fi/findspark 在Python开发者的世界里，Apache Spark凭借其强大的大数据处理能力而广受欢迎，然而PySpark的使用常因不在默认的系统路径中而

overfit同步小助手 2024-09-06 13:03:13 0 收藏

zookeeper+kafka消息队列群集部署

消息队列是一种软件系统组件，它允许在分布式系统中发送和接收消息。消息队列提供了一种异步通信模式，在这种模式下，发送方和接收方不需要同时在线。消息队列可以存储消息直到接收方准备好处理它们为止。

overfit同步小助手 2024-09-06 12:03:53 0 收藏

0基础学习spark

0基础学习spark的一些笔记和总结

overfit同步小助手 2024-09-06 12:03:32 0 收藏

Flintrock：Apache Spark 集群管理工具指南

大数据-113 Flink DataStreamAPI 程序输入源自定义输入源非并行源与并行源

kafka学习（三）：生产者

【问题解决】docker上运行了rabbitmq的容器，但是无法访问web页面

Kafka-时间轮和延迟操作-源码流程

Kafka【二】关于消费者组（Consumer Group）、分区（partition）和副本（replica）的理解

linux centos rabbitmq3.7.5 一键安装部署

zookeeper+kafka消息队列群集部署

Kettle下载安装

Gather：开启绝密社交和收益双重惊喜之旅

Day16_Zookeeper

南大通用GBase 8s大对象处理：简化大数据插入与管理

宝塔面板安装RabbitMQ（已解决）

学习大数据DAY41 Hive 分区表创建

北京御龙古今艺术剧院山东分院授牌仪式暨七夕之夜演唱会成功举办

HiveSwarm 使用教程

决策模型和符号（DMN）

探索找寻火花：简化你的PySpark之旅

zookeeper+kafka消息队列群集部署

0基础学习spark

作者榜

资讯小助手

内容小助手

Deephub

奕凯