大数据 - overfit.cn

通过Elasticsearch 8、Kibana、Filebeat实现日志的监控及统计

overfit同步小助手 2022-09-08 07:54:01 0 收藏

flink 窗口和水位线

window、watermark

overfit同步小助手 2022-09-08 07:53:57 0 收藏

hbase

Hbase架构图及读写流程

overfit同步小助手 2022-09-08 07:53:54 0 收藏

Elasticsearch：无需基本身份验证即可创建用于访问的不记名令牌

在很多的时候我们并不希望把用户名及密码分发出去，这是因为一旦拥有用户名及密码，你就可以直接登录系统，你甚至可以做更多的事情。另外一方面，用户名及密码还没有期限设定，除非我们在系统中把这个用户删除掉。为了能够使得客户端能够正常访问 Elasticsearch 集群，我们可以创建 API key 来进行

overfit同步小助手 2022-09-07 10:54:24 0 收藏

RocketMQ源码(7)—Producer发送消息源码(1)—发送消息的总体流程【一万字】

基于RocketMQ 4.9.3，详细的介绍了Producer发送消息的总体流程的源码，包括生产者重试机制、生产者故障转移机制、VIP通道等知识都会一一介绍。

overfit同步小助手 2022-09-07 10:54:18 0 收藏

大数据_湖仓一体:下一代存储解决方案

湖仓一体可以存储、优化、分析和访问所有类型的数据，无论数据是结构化的、半结构化的，还是非结构化的，这一点和数据库不同，但和数据湖差不多。湖仓一体可以存储、优化、分析和访问所有类型的数据，无论数据是结构化的、半结构化的，还是非结构化的，这一点和数据库不同，但和数据湖差不多。新的系统设计让湖仓一体成为可

overfit同步小助手 2022-09-07 10:54:13 0 收藏

【毕业设计】基于大数据的高考数据分析 - python 大数据可视化

🚩 基于大数据的高考数据分析🥇学长这里给一个题目综合评分(每项满分5分)🧿 选题指导, 项目分享：https://gitee.com/dancheng-senior/project-sharing-1/blob/master/%E6%AF%95%E8%AE%BE%E6%8C%87%E5%AF

overfit同步小助手 2022-09-07 10:54:09 0 收藏

猿创征文｜【云原生 | 27】Docker部署运行开源消息队列实现RabbitMQ

AMQP架构中有两个主要组件：Exchange和Queue，两者都在服务端，又称Broker，由RabbitMQ实现的。客户端通常有Producer和Consumer两种类型

overfit同步小助手 2022-09-07 10:53:56 0 收藏

折腾一晚上的事情，明白了一个道理

感悟：有时候很简单的笨办法，比那些高大上的技术要实用的多。有一个数据同步，大约4亿条记录，没有分区。现在要按照天，小时分区写入到iceberg的分区表中。源数据中本身就是很多几十k大小的非常多的小文件。于是在读取时，总想着要shuffle，合并小文件,于是是这样的：hive_df = spark.t

overfit同步小助手 2022-09-06 07:53:53 0 收藏

远程小组软件开发过程(3):人

本节内容可能不会很长，但是还是希望尽可能把这个环节重要的骨架勾勒出来。有一个经典的问题是：“如果你是一个投资人，要投资一个项目，核心是看什么？项目还是团队？”。与之对应的一个问题是：“如果你是一位创业者，创业的基石是一个独特的项目还是一个优秀的团队？”当然这种二选一的问题往往都只强调了某一个方面，并

overfit同步小助手 2022-09-06 07:53:35 0 收藏

【12. 文件系统管理】

🎉作者简介:👓博主在读机器人研究生，目前研一。对计算机后端感兴趣，喜欢c++,go,python,目前熟悉c++，go语言，数据库，网络编程，了解分布式等相关内容📃个人主页：🔎支持👍就是给予我最大的支持！🎁💛本文摘要💛。

overfit同步小助手 2022-09-05 07:54:25 0 收藏

【10. 信号量和管程】

🎉作者简介:👓博主在读机器人研究生，目前研一。对计算机后端感兴趣，喜欢c++,go,python,目前熟悉c++，go语言，数据库，网络编程，了解分布式等相关内容📃个人主页：🔎支持👍就是给予我最大的支持！🎁💛本文摘要💛。

overfit同步小助手 2022-09-05 07:54:21 0 收藏

什么是EMC认证？

一文带你了解什么事EMC认证，为什么要进行EMC认证，EMC认证都有哪些

overfit同步小助手 2022-09-05 07:54:17 0 收藏

zookeeper的ZAB协议的原理以及底层源码实现超级详解

zookeeper的zab协议详解

overfit同步小助手 2022-09-05 07:54:14 0 收藏

shiro与springSecurity

本文章介绍市面上常用的两大安全框架。

overfit同步小助手 2022-09-05 07:54:10 0 收藏

【毕业设计】基于机器学习与大数据的糖尿病预测

本项目以体检数据集为样本进行了机器学习的预测，但是需要注意几个问题：体检数据量太少，仅有1006条可分析数据，这对于糖尿病预测来说是远远不足的，所分析的结果代表性不强。这里的数据糖尿病和正常人基本相当，而真实的数据具有很强的不平衡性。也就是说，糖尿病患者要远少于正常人，这种不平衡的数据集给真实情况下

overfit同步小助手 2022-09-05 07:54:06 0 收藏

1.9通过脚本安装数据库服务

1.10-1.13基础服务的操作命令已经编写成shell脚本，通过脚本进行一键安装。如下：节点执行脚本进行安装1.10安装Mysql数据库服务（1）安装mysql服务（2）修改mysql配置文件参数修改文件[mysqld]中添加（3）启动服务（4）修改文件参数[Service]新添加两行如下参数：（

overfit同步小助手 2022-09-05 07:54:03 0 收藏

一篇文章读懂什么是CAP(基础入门)

一篇文章读懂什么是CAP，欢迎打卡，学习交流！

overfit同步小助手 2022-09-05 07:53:59 0 收藏

DDD - 事件风暴从理论到落地

事件风暴是由 Alberto Brandolini 发明的一种轻量级，基于 DDD 概念的系统分析方法，事件风暴（EventStorming）是一种以研讨会（workshop，也有翻译为“工作坊”的）的形式开展的，用于，特别是具有复杂流程的业务领域的系统分析方法。它有不同的风格，可以在不同的场景中使

overfit同步小助手 2022-09-05 07:53:56 0 收藏

【SQL屠夫系列】leetcode-180. 连续出现的数字-(实战扩展：连续登陆N天）

overfit同步小助手 2022-09-05 07:53:52 0 收藏