大数据 - overfit.cn

和 chatgpt 聊了一会儿分布式锁 redis/zookeeper distributed lock

感觉聊的差不多了，我们让 chatGPT 出一个对比的表格。特点RedisZooKeeper数据结构Redis使用字符串数据类型存储锁信息ZooKeeper使用ZNode节点存储锁信息实现方式Redis使用单节点或者Redis集群实现分布式锁ZooKeeper使用ZooKeeper集群实现分布式锁性

overfit同步小助手 2023-05-01 14:03:44 0 收藏

zookeeper单节点部署，手把手从零到一

zookeeper单节点部署及异常解决

overfit同步小助手 2023-05-01 13:04:05 0 收藏

Logstash：使用自定义正则表达式模式

Logstash是一种服务器端数据处理管道，可同时从多个来源获取数据，对其进行转换，然后将其发送到 “存储”（如 Elasticsearch）。Grok是 Logstash 中的过滤器，用于将非结构化数据解析为结构化和可查询的内容。是定义搜索模式的字符序列。如果你已经在运行 Logstash，则无需

overfit同步小助手 2023-05-01 12:03:33 0 收藏

Zookeeper客户端ZkClient、Curator的使用，史上最详细的教程来啦~

overfit同步小助手 2023-05-01 10:03:59 0 收藏

分享：软件全面国产化替代，10款数据库TPC-C测评哪家强

本文来自OceanBase社区分享，仅限交流探讨。原作者风华流沙，武汉东方赛思数据部总负责人。

overfit同步小助手 2023-05-01 09:03:40 0 收藏

安装RabbitMQ出现Plugin configuration unchanged.问题

安装RabbitMQ出现Plugin configuration unchanged.问题的解决方法

overfit同步小助手 2023-05-01 08:03:46 0 收藏

hadoop连接finalshell及jdk配置

Hadoop连接finalshell及jdk配置

overfit同步小助手 2023-05-01 08:03:41 0 收藏

【elasticsearch】elasticsearch分片和副本

总之，每个索引可以被分成多个分片。每个分片可以有0个或者多个副本。一旦复制了，索引就会有主分片(作为复制源的源分片)和复制分片(主分片的拷贝)的区别。分片和副本的数量可以在创建索引的时候指定。但在创建索引后，可以动态的修改副本的数量，但不能改变分片的数量默认情况下，elasticsearch中的每个

overfit同步小助手 2023-05-01 07:03:53 0 收藏

Flink1.16 发布新特性

广义的概念上，能够捕获数据变更的技术，我们都可以称为CDC （Change Data Capture）。通常我们说的CDC技术主要面向数据库的变更，是一种用于捕获数据库中数据变更的技术。其实我觉得数仓分为实时和离线最好的状态（个人想法）。meetup看了两遍，第一遍感觉听着讲change log那节

overfit同步小助手 2023-05-01 07:03:40 0 收藏

Elasticsearch 学习+SpringBoot实战教程（三）

经过了前面2课的学习我们已经大致明白了ES怎么使用，包括原生语句，javaapi等等，现在我们要在业务中使用了，所以我们选择spring-data作为我们的ORM框架，快速开发代码。同时需要给规范化操作。

overfit同步小助手 2023-05-01 07:03:37 0 收藏

高并发系统设计 -- 粉丝关注列表如何设计

上图我们简称relation页。

overfit同步小助手 2023-05-01 07:03:31 0 收藏

3D可视化大屏是如何实现的？

3D可视化是指拥有3D效果的数据可视化，对于所要展示的数据可视化内容还原出真实场景，并实时接入数据，在面对复杂操作时灵活应对，使得整个场景在大屏上的展示更具立体、更具科技感、更具易用性。

overfit同步小助手 2023-05-01 06:03:32 0 收藏

Hive学习——单机版Hive的安装

overfit同步小助手 2023-05-01 05:04:02 0 收藏

【状态管理｜概述】Flink的状态管理：为什么需要state、怎么保存state、对于state过大怎么处理

overfit同步小助手 2023-05-01 03:03:38 0 收藏

关于连锁，我们与ChatGPT的聊了一下

下文内容为编者与ChatGPT的实际对话并附对话截图。对话内容为与连锁相关的问答以及建议咨询。内容仅供参考！ChatGPT相较于2020年推出即被遗忘的Chat3，最明显区别亦是本次出圈核心原因的一点在于交互界面——即对话框，而内容仍在接受使用者的考量与训练。对话如下：请介绍一下你自己我是OpenA

overfit同步小助手 2023-05-01 02:03:39 0 收藏

大数据4 - 分布式计算

概述1.分布式计算概述分散->汇总模式：1.将数据分片，多台服务器各自负责一部分数据处理2.然后将各自的结果，进行汇总处理3.最终得到想要的计算结果1.什么是计算、分布式计算？•计算：对数据进行处理，使用统计分析等手段得到需要的结果•分布式计算：多台服务器协同工作，共同完成一个计算任务2.分布式计算

overfit同步小助手 2023-05-01 01:03:55 0 收藏

GreenPlum 安装

Greenplum是基于开源PostgreSQL的分布式数据库，采用shared-nothing架构，即主机、操作系统、内存、存储都是每台服务器独立自我控制，不存在共享。Greenplum本质上是一个关系型数据库集群，实际上是由多个独立的数据库服务组合而成的一个逻辑数据库。与Oracle的RAC不同

overfit同步小助手 2023-05-01 01:03:46 0 收藏

Hive安装配置详解（提供实验平台）

文中涉及的 Hive 配置建立在已有 Hadoop 环境的基础上，进入实验平台提供的环境启动即可无需自行搭建

overfit同步小助手 2023-05-01 01:03:37 0 收藏

RabbitMQ相关问题

RabbitMQ相关热点问题：消息幂等、消息积压、消息可靠性、延时队列、消息顺序

overfit同步小助手 2023-05-01 00:03:32 0 收藏

springboot kafka 实现延时队列

延时队列的技术实现方案有：redis延时队列，Kafka延时队列，rabbit延时队列，Kafka延时队列等本文章springboot kafka 实现延时队列，使用Kafka消费者的pause函数（暂停）和resume函数（恢复）+定时任务+事件监听机制+工厂。延时任务的应用场景：1，订单超时自动

overfit同步小助手 2023-04-30 23:03:55 0 收藏