大数据 - overfit.cn

【系统学习RabbitMQ】java入门及Spring系列(每个API附带项目示例）

一般是在监听中编写while循环通过consumer.nextDelivery获取下一条消息进行消费。使用自定义的Consumer更加方便，解耦合[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-o30WgiHA-1679235160541)(https://foruda

overfit同步小助手 2023-04-01 10:04:55 0 收藏

Python机器学习——分析评论情感

overfit同步小助手 2023-04-01 10:04:51 0 收藏

ClickHouse查询语句详解

ClickHouse查询语句兼容大部分SQL语法，并且进行了更加丰富的扩展，查询语句模板如下：[WITH expr_list|(subquery)]SELECT [DISTINCT [ON (column1, column2, ...)]] expr_list[FROM [db.]table |

overfit同步小助手 2023-04-01 10:04:41 0 收藏

spark 安装详细步骤

3、在目录/home/hadoop/software下解压：tar -zxvf spark-1.6.2-bin-hadoop2.6.tgz。4、进入conf目录,复制文件cp spark-env.sh.template spark-env.sh。6、cd 切换到sbin目录下使用 ./start-a

overfit同步小助手 2023-04-01 10:04:30 0 收藏

老杨说运维 | 2023，浅谈智能运维趋势（一）

应加强信息技术应用创新，用换道超车的思路，以数字化转型作为抓手，提升可自主创新的国产化替代率，将科技命脉掌握在自己手中，使内需成为未来经济上行的重要推手。因此在数字化转型中，老杨认为应从以下几个方面重点着手

overfit同步小助手 2023-04-01 10:04:18 0 收藏

【Web后端架构】2022年10个最佳Web开发后端框架

这些都是2022年在Java、Ruby、Python、JavaScript、PHP、Scala和Golang中进行web开发的最佳后端开发框架在本文中，我将与您分享创建web应用程序的10个最好的后端框架。Web开发通常分为两类：前端开发和后端开发。后端开发人员负责构建web应用程序的服务器端。当前

overfit同步小助手 2023-04-01 10:04:13 0 收藏

Hive设置连接用户名和密码

当hive客户端搭建起来之后，应用项目远程连接hive需要设置用户名和密码；由于hive默认的用户名和密码都是空的，所以需要我们自定义用户名和密码；首先，添加hive的maven依赖，这儿maven的版本和hive运行的jar版本保持一致，不然容易出问题，hive/lib下查看jar的版本信息。需要

overfit同步小助手 2023-04-01 09:04:58 0 收藏

使用 Docker 安装 Hadoop 集群

相信大家都有过玩虚拟机的经验，也相信大家有想搭一个大数据集群偶尔在自己电脑上做做测试。使用虚拟机是可以完成的，但是过程非常漫长，而且很多操作不能以后重复使用。这里我近期使用Docker完成了测试集群的搭建，我想用的时候，十几秒就可以直接启动，速度很快。而且所有的镜像都可以上传hub云端，想用的时候，

overfit同步小助手 2023-04-01 09:04:50 0 收藏

Linux部署Kafka及常见问题记录

（物理上不同Topic的消息分开存储，逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic即可生产或消费数据而不必关心数据存于何处）kafka消息发送的时候 ,考虑到性能可以采用打包方式发送，也就是说传统的消息是一条一条发送，现在可以先把需要发送的消息缓

overfit同步小助手 2023-04-01 09:04:46 0 收藏

RabbitMQ之集群管理

介绍了RabbitMQ的集群管理

overfit同步小助手 2023-04-01 09:04:39 0 收藏

Kafka介绍

kafka各组件的作用及其特点

overfit同步小助手 2023-04-01 09:04:36 0 收藏

Flink connector Oracle CDC 实时同步数据到MySQL（Oracle19c）

注意不要使用Oracle的SYS和SYSTEM用户做为CDC用户。因为这两个用户能够捕获到大量Oracle数据库内部的变更信息，对于业务数据来说是不必要的。Debezium会过滤掉这两个用户捕获到的变更内容。'/opt/oracle/oradata/recovery_area'这个路径如果不存在的话

overfit同步小助手 2023-04-01 09:04:33 0 收藏

Windows 下 Kafka 2.8.1 启动报错“输入行太长”问题解决方案

Windows 下 Kafka 2.8.1 启动报错“输入行太长”问题的解决方案

overfit同步小助手 2023-04-01 09:04:21 0 收藏

spark sql（五）sparksql支持查询哪些数据源，查询hive与查询mysql的区别

sparksql支持查询的数据源类型，以及查询mysql和查询hive的源码过程简析

overfit同步小助手 2023-04-01 09:04:16 0 收藏

安装librdkafka和使用C语言操作kafka的范例

一、安装librdkafka。二、开启kafka相关服务：启动zookeeper、启动Kafka、创建topic。三、c语言操作kafka的范例：消费者、生产者、生产者和消费者的交互。

overfit同步小助手 2023-04-01 08:05:06 0 收藏

Spark环境搭建（Hadoop YARN模式）

按照前面环境部署中所学习的，如果我们想要一个稳定的生产Spark环境，那么最优的选择就是构建：HA StandAlone集群。不过在企业中，服务器的资源总是紧张的，许多企业不管做什么业务，都基本上会有Hadoop集群。也就是会有YARN集群。对于企业来说，在已有YARN集群的前提下在单独准备Spa

overfit同步小助手 2023-04-01 08:05:00 0 收藏

维度建模的三种模式

星型模式，雪花模式，星座模式

overfit同步小助手 2023-04-01 08:04:57 0 收藏

ElasticSearch中基础API操作

2:建立的客户端后，我们需要先进行索引的创建，查询，删除操作：2.1：创建索引：响应： 2.3：删除索引：响应： 3：索引创建好后我们需要将索引里面插入文档数据，包过数据的查询删除等等操作3.1：将数据插入索引：响应：3.1.1：首先建立一个实体类存放我们要插入的数据类：U

overfit同步小助手 2023-04-01 08:04:52 0 收藏

Hive 元数据服务 MetaStore

1. 概念MetaSore 是 Hive 元数据存储的地方。Hive 数据库、表、函数等的定义都存储在 MetaStore 中。根据系统配置方式，统计信息和授权记录也可以存储在这。Hive 或者其他执行引擎在运行时可以使用这些数据来确定如何解析，授权以及有效执行用户的查询。MetaStore 分为两

overfit同步小助手 2023-04-01 08:04:48 0 收藏

Hive之explode()函数和posexplode()函数和lateral view函数

目录1、explode()函数2、posexplode()函数3、lateral view函数1、explode()函数英文释义：explode() takes in an array (or a map) as an input and outputs the elements of the ar

overfit同步小助手 2023-04-01 08:04:38 0 收藏