大数据 - overfit.cn

Hive环境搭建（保姆级教程）

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。本文将详细介绍Hive的本地安装模式的具体过程。

overfit同步小助手 2023-04-02 10:04:48 0 收藏

大数据Flink进阶（七）：Flink批和流案例总结

a. 获取flink的执行环境，批和流不同，Execution Environment。b. 加载数据数据-- soure。c. 对加载的数据进行转换-- transformation。d. 对结果进行保存或者打印-- sink。e. 触发flink程序的执行 --env.execute()在Fli

overfit同步小助手 2023-04-02 10:04:41 0 收藏

流批一体计算引擎-7-[Flink]的DataStream连接器

DataStream连接器

overfit同步小助手 2023-04-02 10:04:38 0 收藏

如何用Redis实现分布式锁？

分布锁很重要，经常作为面试考题，接下来就让我们一起来了解下分布式锁

overfit同步小助手 2023-04-02 10:04:35 0 收藏

【Elasticsearch】Elasticsearch命令行操作

集群这一概念已经遍及天下了，在Elasticsearch中也不例外，可以将多台Elasticsearch节点组成集群使用，可以在任意一台节点上进行搜索。

overfit同步小助手 2023-04-02 10:04:28 0 收藏

phoenix连接hbase

phoenix简化hbase连接操作，对sql操更友好，能和spark、flink无缝对接，实在是海量数据操作的利器

overfit同步小助手 2023-04-02 10:04:22 0 收藏

Flink on-k8s operator application 模式

flink on k8s operator

overfit同步小助手 2023-04-02 10:04:19 0 收藏

Kafka快速入门（Kafka消费者）

Kafka 消费者1. Kafka 消费方式2 Kafka 消费者工作流程2.1 消费者总体工作流程2.2 消费者组原理Consumer Group（CG）：消费者组，由多个consumer组成。形成一个消费者组的条件，是所有消费者的groupid相同。• 消费者组内每个消费者负责消费不同分区的数据

overfit同步小助手 2023-04-02 09:04:55 0 收藏

HBase集群部署

HBase要和hadoop的版本对应下载，否则做深层次任务会出问题。一、前期准备二、HBase下载1. 查看HBase与hadoop版本对应关系2. hbase的下载3. 将hbase的tar包上传到linux 下二、安装hbase1. 解压2. HBase的文件配置中还写的有一些内容，如果有的话删

overfit同步小助手 2023-04-02 09:04:51 0 收藏

k8s部署kafka集群

k8s 安装kafka集群

overfit同步小助手 2023-04-02 09:04:45 0 收藏

IDEA 中使用 Big Data Tools 连接大数据组件

简介Big Data Tools 插件可用于 Intellij Idea 2019.2 及以后的版本。它提供了使用 Zeppelin，AWS S3，Spark，Google Cloud Storage，Minio，Linode，数字开放空间，Microsoft Azure 和 Hadoop 分布式文

overfit同步小助手 2023-04-02 09:04:40 0 收藏

数据仓库与数据库的区别

通过数据分层管理可以简化数据清洗的过程，因为把原来一步的工作分到了多个步骤去完成，相当于把一个复杂的工作拆成了多个简单的工作，把一个大的黑盒变成了一个白盒，每一层的处理逻辑都相对简单和容易理解，这样我们比较容易保证每一个步骤的正确性，当数据发生错误的时候，往往我们只需要局部调整某个步骤即可。的过程，

overfit同步小助手 2023-04-02 09:04:37 0 收藏

Springboot+RabbitMQ+ACK机制(生产方确认(全局、局部)、消费方确认)、知识盲区

overfit同步小助手 2023-04-02 09:04:26 0 收藏

Spark - 介绍及使用 Scala、Java、Python 三种语言演示

分布式机器学习的框架，可以使用许多常见的机器学习和统计算法，例如：支持向量机、回归、线性回归、逻辑回归、决策树、朴素贝叶斯、汇总统计、相关性、分层抽样、假设检定、随即数据生成等，简化大规模机器学习。的快速调度能力来运行流分析，通过时间窗口截取小批量的数据并可以对之运行。类似，Spark

overfit同步小助手 2023-04-02 09:04:17 0 收藏

Doris进阶——初识Doris_FE、BE、BROKER的扩缩容

Doris的简单介绍以及FE、BE、BROKER的扩缩容

overfit同步小助手 2023-04-02 09:04:13 0 收藏

Hadoop3 - HDFS DataNode 动态扩容和缩容

已有HDFS集群容量已经不能满足存储数据的需求，需要在原有集群基础上动态添加新的DataNode节点。节点已经上线，但没有数据块的存储，使得集群整体来看负载不均衡。DataNode 缩容，不像扩容那样启动一个节点即可，缩容还需要把当前节点数据移出去才可以，：旧的服务器需要进行退役更换，暂停服务，需

overfit同步小助手 2023-04-02 09:04:11 0 收藏

docker 安装Es

docker 安装Es包含配置文件命令

overfit同步小助手 2023-04-02 08:04:56 0 收藏

心跳信号分类预测（天池数据集）

心跳信号分类预测处理分享

overfit同步小助手 2023-04-02 08:04:52 0 收藏

Elasticsearch漏洞汇总比较全

本测试环境同时运行了Tomcat和ElasticSearch，Tomcat目录在/usr/local/tomcat，web目录是/usr/local/tomcat/webapps；之后的新版，配置文件elasticsearch.yml中必须存在path.repo，该配置值为一个目录，且该目录必须可写

overfit同步小助手 2023-04-02 08:04:49 0 收藏

数学规划（Python cvxpy、scipy.optimize）

数学规划学习笔记

overfit同步小助手 2023-04-02 08:04:46 0 收藏