大数据 - overfit.cn

emqx学习笔记（1）- emqx的下载和安装

EMQX 是一款大规模可弹性伸缩的云原生分布式物联网 MQTT 消息服务器。作为全球最具扩展性的 MQTT 消息服务器，EMQX 提供了高效可靠海量物联网设备连接，能够高性能实时移动与处理消息和事件流数据，帮助您快速构建关键业务的物联网平台与应用。

overfit同步小助手 2023-04-04 18:03:57 0 收藏

Elasticsearch：集群管理

在今天的文章中，我们应该学习如何管理我们的集群。备份和分片分配是我们应该能够执行的基本任务。

overfit同步小助手 2023-04-04 17:05:01 0 收藏

window环境下部署hbase(仅测试环境)

本文章目的是在window系统部署一套单机版的测试用hbase，项目甲方提供的hbase云服务比较老。

overfit同步小助手 2023-04-04 17:04:56 0 收藏

Windows 下Zookeeper 配置参数解读和查看注册了哪些服务

windows 下 zookeepr 配置文件参数解读,同时查看本地zookeeper 注册了那些服务

overfit同步小助手 2023-04-04 17:04:39 0 收藏

HDFS高可用单NameNode从standby恢复为active（二）

将高可用hdfs ha降为单namenode可行。如果两个namenode有一个不能用了，紧急情况下就可以通过修改配置的方式将hdfs降低为单namenode的集群继续进行工作。

overfit同步小助手 2023-04-04 17:04:29 0 收藏

机器学习全面知识点总结（小白入门！）

**机器学习相关总结（小白入门！）**目录机器学习的特点机器学习的研究对象机器学习的应用#大家好，这篇博文主要介绍机器学习相关的基本理论和部分应用，目的是帮助初学者对机器学习建立初步的认知框架，文章通俗易懂，以后博主还会根据具体的机器学习实践和部分模型模型应用更深入的帮助大家汇总相关知识。现在让我们

overfit同步小助手 2023-04-04 17:04:20 0 收藏

新一代数据仓库SnowFlake

Snowflake是一种多租户、事务性、安全、高度可扩展的弹性系统，具备完整的SQL支持和半结构化和schema-less数据模式支持。用户只需将数据导入云上，就可以立即利用他们熟悉的工具和界面进行管理和查询。从2012年底，Snowflake开始计划实施，到2015年6月，Snowflake已经可

overfit同步小助手 2023-04-04 16:04:34 0 收藏

验证性因子分析（CFA）全流程

本篇案例想要研究“实际数据是否符合理论模型假设的结构”，利用验证性因子分析进行说明，由于是问卷数据，所以进行信度分析和探索性因子分析，分析数据的信度、效度以及变量与测量项之间的关系，发现数据良好，接着对数据进行验证性因子分析，发现数据拟合不是很好，对模型进行修正，建立协方差关系，经过反复修正，最后得

overfit同步小助手 2023-04-04 16:04:31 0 收藏

升到Flink版本到1.15.0

Flink升级1.15.0

overfit同步小助手 2023-04-04 16:04:26 0 收藏

mysql 与 es 数据同步常见方案

这种方式能否实现秒级的数据同步，取决于 mysql 表中的数据量和用来收集数据的 sql 执行时间。当然能否真正做到秒级的数据同步，除了 sql 以外，其他环节（比如整理数据格式，传输至 es）的耗时也要考虑。优点：这种方式的好处是代码侵入性低，不需要在之前写 mysql 的地方加写 es 的代码。

overfit同步小助手 2023-04-04 16:04:24 0 收藏

k8s部署es集群和kibana

overfit同步小助手 2023-04-04 16:04:03 0 收藏

[业务逻辑] 订单超时怎么处理

订单超时如何处理的方案

overfit同步小助手 2023-04-04 16:03:58 0 收藏

SpringBoot 结合RabbitMQ与Redis实现商品的并发下单【SpringBoot系列12】

本文章是基于 RabbitMQ 消息队列 + Redis 实现的下单

overfit同步小助手 2023-04-04 16:03:54 0 收藏

linux 卸载elasticsearch及安装elasticsearch8.5(rpm)

overfit同步小助手 2023-04-04 15:04:46 0 收藏

IDEA中Spark配置

Spark快速配置

overfit同步小助手 2023-04-04 15:04:26 0 收藏

Python-Sklearn内置数据集介绍与“三板斧”

对sklearn中的内置数据集鸢尾花数据集（iris）和波士顿房价数据集（boston）以及手写数字数据集（digits）为例，学习查看sklearn中自带数据集的相关概论以及数据处理“三板斧”。

overfit同步小助手 2023-04-04 15:04:24 0 收藏

【软件安装】Linux中RabbitMQ的安装

① 本篇是基于Linux操作系统中的安装，故先准备一个干净的Linux操作系统。本文中所有的操作基于CentOS8进行安装演示；② 接下来的演示文本中，红色字体为操作步骤，黑色字体为解释说明；③ 确保Linux系统中已经安装好必要的环境，不确定环境是否配置齐全的，可以执行: yum -y insta

overfit同步小助手 2023-04-04 15:04:08 0 收藏

RabbitMQ实战

解耦：在项目启动之初来预测将来会碰到什么需求是极其困难的。消息中间件在处理过程中间插入了一个隐含的、基于数据的接口层，两边的处理过程都要实现这一接口，这允许你独立地扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束即可冗余〈存储) 有些情况下，处理数据的过程会失败。消息中间件可以把数据进行持久

overfit同步小助手 2023-04-04 15:04:01 0 收藏

1.elasticsearch文档存储（保存|修改|删除）

1.本文的es版本是7.2.1；；本文介绍的是 es数据存储开发方式；3.文档存储包括文档保存，修改，删除；（文档查询的开发方式比较复杂，单独新开一篇阐述）

overfit同步小助手 2023-04-04 14:04:47 0 收藏

一文快速学会hadoop完全分布式集群搭建，很详细

hadoop的启动模式有三种，一个是本地模式，一个是伪分布式模式，还有一个是集群模式。为了学习hadoop，这里需要搭建一个完全分布式的集群。希望你先把准备工作给看一下，因为我们的配置都是前后一致的。本文因为想让大家学习一下集群分发脚本，所以在模板虚拟机里面少放了很多东西，以后会写一个快速搭建集群的

overfit同步小助手 2023-04-04 14:04:41 0 收藏