大数据 - overfit.cn

Linux基本命令

Linux基本命令# 创建目录 mkdir mkdir -p /usr/local/test/shell# 切换目录 cd cd /usr/local/test/shell# 查看目录下文件 ll 或者 ls 都行ls # 显示当前目录 pwdpwd# 编辑新增文件内容 vim # 按 i：插入

overfit同步小助手 2022-03-15 13:09:13 0 收藏

Hadoop集群高可用及zookeeper+kafka组件搭建

一.Hadoop集群高可用角色与配置主机名 IP地址角色服务 hadoop1 192.168.1.50 namenode, resourcemanager, ZKFC hadoop2 192.168.1.56 namenode, resourcemanager, ZKF

overfit同步小助手 2022-03-15 07:09:57 0 收藏

Elasticsearch镜像打包记录

对制作Elasticsearch镜像并打包的个人记录

overfit同步小助手 2022-03-15 07:09:51 0 收藏

6. 数据仓库环境准备

6. 数据仓库环境准备数据仓库环境准备数据仓库运行环境Hive环境搭建Hive on Spark 配置Hive on Spark 测试Yarn环境配置数据仓库开发环境启动 HiveServer2配置 DataGrip 连接创建连接配置连接属性测试使用模拟数据准备用户行为日志业务数据生成模拟数据全量表

overfit同步小助手 2022-03-15 07:09:47 0 收藏

努力成为一名数据分析师

一、什么是数据分析？观测、实验、应用二、重新认识数据分析观测：对事物形成客观量化的认知（报表、图表、仪表盘）。实验：发现规律、验证假设（科学研究、A/B测试）。应用：不断基于数据反馈迭代产品。三、观测观察：采集数据、存储数据、展示数据。1.采集数据：解析系统日志、埋点获取新数据、通过传感器采集（手环

overfit同步小助手 2022-03-15 07:09:43 0 收藏

3分钟SpringData整合 ElasticSearch 实现CRUD超级详细

文章目录1.导入依赖2.配置 yml3.创建Bean4.创建接口继承 CrudRepository 接口5. 创建service 注入接口代理类对象6.主启动类上添加 @EnableElasticsearchRepositories7.编写方法名 ⭐️秋日的晚霞⭐️ ⭐️玲珑骰子安红豆入

overfit同步小助手 2022-03-15 07:09:38 0 收藏

基于Curator（zookeeper）实现leader选举

在分布式计算中，leader election是很重要的一个功能，这个选举过程是这样子的：指派一个进程作为组织者，将任务分发给各节点。在任务开始前，哪个节点都不知道谁是leader或者coordinator。当选举算法开始执行后，每个节点最终会得到一个唯一的节点作为任务leader。除此之外，选举还

overfit同步小助手 2022-03-15 07:09:35 0 收藏

【Kafka从入门到成神系列五】Kafka 幂等性及事务

大家好，我是爱敲代码的小黄，独角兽企业的Java开发工程师，Java领域新星创作者。这是我的系列专栏：Kafka 从入门到成神。如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步。如果感觉博主的文章还不错的话，请三连支持一下博主哦。

overfit同步小助手 2022-03-15 07:09:31 0 收藏

PLSQL 大数据开发ENDS 开发存储过程银行BI数据实战

存储过程

overfit同步小助手 2022-03-14 07:10:01 0 收藏

获取java性能数据的工具(未完成，待整理)

test

overfit同步小助手 2022-03-14 07:09:57 0 收藏

Spring Cloud Stream的配置及使用——以RabbitMQ为例

Spring Cloud Stream配置及使用，以RabbtiMQ为例

overfit同步小助手 2022-03-14 07:09:54 0 收藏

RabbitMQ消息堆积问题

如何解决数百万消息堆积，无法及时消费的问题

overfit同步小助手 2022-03-14 07:09:50 0 收藏

Kylin简介与环境配置（保姆级教程）

Apache Kylin是基于Hadoop大数据平台的一个开源联机分析处理（Online Analytical Processing，OLAP）引擎。它采用多维立方体**预计算**技术，将大数据的SQL查询速度从之前的分钟乃至小时级别提升到亚秒级别，这种百倍、千倍的速度提升，为超大规模数据集上的交互

overfit同步小助手 2022-03-14 07:09:47 0 收藏

今天，我 22 岁了 ...

思维决定命运，态度决定成功！

overfit同步小助手 2022-03-14 07:09:44 0 收藏

全国多年平均水汽压空间分布数据

overfit同步小助手 2022-03-14 07:09:39 0 收藏

ZooKeeper客户端源码（二）——向服务端发起请求（顺序响应+同步阻塞+异步回调）

客户端与服务端通信的最小单元是Packet。所有请求在发送给服务端之前，都需要先构建一个Packet，再将Packet提交给请求处理队列outgoingQueue并唤醒SendThread线程，最后处理写事件，从outgoingQueue中取出Packet，将其序列化写入网络发送缓冲区。

overfit同步小助手 2022-03-14 07:09:36 0 收藏

springboot 2.0集成elasticsearch 7.6.2(集群)

小伙伴们，你们好呀，我是老寇，跟我一起学习es 7.6.2注：请点击我，获取源码目录一、引入依赖配置pom.xml二、配置application-dev.yml(生产就克隆application-dev改成生产配置)三、配置ES注解四、配置es及swagger五、ES工具类（索引相关配置不懂的，请

overfit同步小助手 2022-03-14 07:09:32 0 收藏

zookeeper节点类型，整合代码实现服务器动态监听

zookeeper集群、整合代码、监听节点

overfit同步小助手 2022-03-13 07:10:08 0 收藏

zk分布式实现理论，Paxos算法，ZAB协议，CAP定理

overfit同步小助手 2022-03-13 07:10:04 0 收藏

【算法岗面试】某小厂E机器学习

文章目录1.deepFM的FM特点，deep部分设置了多少层，依据2.算法题：爬楼梯3.算法题：最大子数组和4.sql题：商品id、类别、价格，mysql找出找出每类前10大的商品5.1000个学生成绩排序，比快排更快的方法6.常用的数据预处理有哪些操作7.transformer的文本抽取8.反欺诈

overfit同步小助手 2022-03-13 07:10:01 0 收藏