大数据 - overfit.cn

VMware 虚拟机安装 Hadoop/Hive 集群详细教程 (Macbook M1/M2) (第一部分)

以安装 hadoop2 虚拟机作为例子Select ISO Image，选择宿主机上的镜像文件Select OS，选择 Debian10 操作系统Select install CentOS7，选择安装Select start up disk，选择硬盘Select GNOME GUI，选择安装桌面Se

overfit同步小助手 2024-06-01 03:03:43 0 收藏

Spark结课总结

在程序运行过程中值不会发生变化的量为常量或值，常量通过val关键字定义，常量一旦定义就不可更改，即不能对常量进行重新计算或重新赋值。数组是一种存储了相同类型元素的固定大小的顺序集合，Scala定义一个数组的语法格式如下。var arr:Array[String] = Array(元素1,元素2,…)

overfit同步小助手 2024-06-01 03:03:37 0 收藏

25道RabbitMQ面试题含答案（很全）_mqtt面试问题(1)

RabbitMQ是一款开源的，Erlang编写的，消息中间件；最大的特点就是消费并不需要确保提供方存在，实现了服务之间的高度解耦，可以用它来：解耦、异步、削峰。

overfit同步小助手 2024-06-01 02:03:47 0 收藏

Flink之Watermark

punctuated:每条数据后都会插入当前事件时间解析出来的watermarkperiodic:周期性生成，默认是200m生成一个watermark在新版本中punctuated已经被标记为过时(当前版本1.18.1)watermark的构造：1.forMontonousTimestamps:时间

overfit同步小助手 2024-06-01 01:03:36 0 收藏

两种方法把数据导入到Hive

本地数据导入到hdfs,hdfs数据导入到hive

overfit同步小助手 2024-06-01 01:03:32 0 收藏

hbase启动报错NoNode for /hbase/master等各种错误咋整？

我在配置伪分布式的hbase时（使用自带的zookeeper），启动hbase shell后报错NoNode for /hbase/master，查看日志文件发现报错Master exiting、Master is initializing尝试了网上的各种办法，包括：①修改hbase-site.xm

overfit同步小助手 2024-06-01 00:04:01 0 收藏

hadoop学习---基于Hive的聊天数据分析报表可视化案例

聊天平台每天都会有大量的用户在线，会出现大量的聊天数据，通过对。

overfit同步小助手 2024-06-01 00:03:58 0 收藏

毕设项目分享地铁大数据客流分析系统设计与实现

Hi，大家好，这里是丹成学长，今天向大家介绍地铁大数据客流分析系统**毕设帮助, 选题指导, 项目分享: **

overfit同步小助手 2024-06-01 00:03:55 0 收藏

centos7安装kafka、zookeeper

Apache Kafka UI 是一个免费的开源 Web UI，用于监控和管理 Apache Kafka 集群。Apache Kafka UI 是一个简单的工具，可让您的数据流可观察，帮助更快地发现和解决问题并提供最佳性能。其轻量级仪表板可以轻松跟踪 Kafka 集群的关键指标 - 代理、主题、分区

overfit同步小助手 2024-06-01 00:03:46 0 收藏

RabbitMQ及web界面安装配置

RabbitMQ是一个开源的消息代理软件，实现了高级消息队列协议(AMQP)。RabbitMQ使用Erlang语言编写，这是一种高性能的编程语言，特别适合于分布式系统的开发。RabbitMQ的核心功能包括消息的发布与订阅、路由、可靠性、安全等。它主要用于实现应用程序之间的异步通信和解耦，允许一个应用

overfit同步小助手 2024-06-01 00:03:37 0 收藏

深入理解图形处理器（GPU）：加速人工智能和大数据计算的引擎

GPU（Graphics processing unit）是一种专门设计用于处理图形和图像的处理器。它的设计初衷是加速图形渲染，以提升计算机图形的性能和质量。与中央处理器（CPU）不同，GPU拥有大量的小型处理单元，能够并行执行大量相似的任务。这使得GPU在处理大规模数据集和复杂算法时比CPU更加高

overfit同步小助手 2024-05-31 23:03:47 0 收藏

深入理解Apache ZooKeeper与Kafka的协同工作原理

在当今的大数据和微服务领域，消息队列已经成为构建高性能、高可用分布式系统的基石。Apache Kafka作为一个广受欢迎的分布式流处理平台，以其出色的吞吐量、低延迟和持久化特性受到业界青睐。与此同时，Apache ZooKeeper作为分布式协调服务，在Kafka中承担了关键的角色

overfit同步小助手 2024-05-31 22:03:12 0 收藏

【WPF应用10】基本控件-StackPanel：布局原理与实际应用

WPF基本控件-StackPanel：布局原理与实际应用

overfit同步小助手 2024-05-31 21:03:30 0 收藏

数据仓库和数据挖掘基础

主要介绍数据仓库和数据挖掘的基本知识。

overfit同步小助手 2024-05-31 21:03:27 0 收藏

MacOS系统安装ZooKeeper 和常见问题解决

Mac OS 苹果系统安装 zookeeper，启动/停止命令，常见问题解决，例如启动报错、安装路径查询、配置文件路径查询等

overfit同步小助手 2024-05-31 20:03:34 0 收藏

SpringCloud系列（7）--Eureka服务端的安装与配置

上一章节我们介绍了Eureka的基础，本章节则介绍Eureka服务端的安装与配置Eureka架构原理图。

overfit同步小助手 2024-05-31 19:03:56 0 收藏

人工智能与地理大数据实验--出租车GPS数据—时空大数据Python处理基础（一）

Python处理地理大数据基础

overfit同步小助手 2024-05-31 19:03:40 0 收藏

如何使用Flink连接openGauss数据库（flink-cdc-connector）

本文会在最后附上代码修改的git patch首先简单介绍下flink，Apache Flink是由Apache软件基金会开发的开源流处理框架，其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和管道方式执行任意流数据程序，Flink的流水线运行时系统可以执行批处理和流处理程

overfit同步小助手 2024-05-31 19:03:32 0 收藏

Hive3.1.3详细安装配置教程及安装时问题解决

可能会出现错误 Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument(ZLjava/lang/String;原因是hive/lib中的gua

overfit同步小助手 2024-05-31 19:03:24 0 收藏

spark常用方法

与合并不同，连接会对键相同的值进行合并，连接方式多种多样，包含内连接、右外连接、左外连接、全外连接，不同的连接方式需要使用不同的连接方法。用户可以使用contains()方法判断列表中是否包含某个元素，若列表中存在指定的元素则返回true，否则返回false。数组是Scala中常用的一种数据结构，数

overfit同步小助手 2024-05-31 18:03:41 0 收藏